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A.2 preK&R C 
后 记 


"X. > 
WE PE 
本 书 作为 学 习 UNIX V6 内 核 源 码 的 参考 读物 ， 值 得 同 读 者 推荐 。 


国内 计算 机 方面 的 翻译 书籍 以 欧美 作者 的 著作 为 主 ， 这 与 相关 的 技术 多 
起 源 于 欧美 有 很 大 关系 。 在 实际 的 学 习 和 工作 中 ， 我 也 接触 了 许多 日 文 
书籍 ， 我 认为 此 领域 的 日 文书 籍 也 很 有 特色 。 因 为 日 文书 籍 很 擅长 从 读 
者 的 角度 出 有 发， 配合 大 量 的 实例 与 图 表 ， 深 入 浅 出 地 将 一 个 复杂 的 问题 
讲解 清楚 ， 非 常 适合 初学 者 或 者 工程 技术 人 员 阅 读 。 


正如 作者 在 前 言 中 写 到 的 ， 这 本 书 是 基于 作者 在 学 习 UNIX V6 内 核 源 
码 过 程 中 的 笔记 和 博客 而 写成 的 ， 因 此 对 初次 接触 UNIX V6 内 核 的 读 
者 而 言 ， 无 疑 是 一 本 很 好 的 参考 读物 。 


但 是 也 应 该 注意 到 ， 正 是 因为 这 一 点 ， 一 些 作者 已 掌握 的 知识 点 ， 书 中 
并 未 详细 阐述 。 因 此 ， 将 本 书 定位 于 参考 书 ， 同 时 配合 附录 中 的 其 他 参 
考 资 料 ， 再 借助 模拟 器 simh 实际 动手 操作 ， 这 样 三 管 齐 下 才能 真正 达 
到 理解 UNIX V6 内 核 源码 的 目的 。 


我 一 直 很 想 将 优秀 的 计算 机 日 文书 籍 介 绍 给 国内 的 广大 读者。 因为 工作 
繁 性 ， 述 迟 没 有 付 诺 实 际 行动 ， 直 到 今年 才 在 图 灵 公 司 的 大 力 支 持 下 实 
现 。 在 这 里 特别 同 本 书 的 编辑 表示 囊 心 的 感谢 ,他们 从 译文 的 逻辑 表达 
和 语法 等 方面 提出 了 宇 贵 的 意见 。 


同时 ， 也 要 癌 原 著作 者 青 柳 隆 宏 先 生 致 敬 。 他 的 语言 表达 非常 严谨 ， 条 
理 十 分 鲜明 。 这 使 得 原著 在 日 本 亚马逊 网 站 中 获得 了 4 星 的 高 分 。 


最 后 ， 我 要 问 家 人 表示 谢意 。 这 本 书 基 本 都 是 利用 平时 下 班 后 和 周末 的 
时 间 来 完成 的 ， 没 有 人 父母、 妻子 及 两 个 可 爱 的 孩子 的 文 持 ， 我 很 难 顺 
利 、 按 时 完成 翻译 工作 。 


本 书 的 翻译 肯定 会 有 许多 不 足 ， 欢 迎 广 大 读者 提出 宝贵 意见 或 来 信 交 
流 。 我 的 邮箱 地 址 是 unixv6.yinzx@gmail.com， 我 会 尽 可 能 给 与 答复 。 


如 果 本 书 能 给 大 家 提供 一 些 帮助 的 话 ， 我 会 感到 十 分 欣慰 。 
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本 书 针对 1975 年 由 贝尔 实验 室 工 发 布 的 UNIX 第 6 版 (Sixth Edition 

Unix， 此 后 简称 为 UNIX V6 ) 的 内 核 源 代码 进行 解说 。 面 向 的 读者 主 

以 及 从 事 计 算 机 相关 行业 的 具有 初中 级 水 平 的 
Ulo 


1 由 美国 的 AT&T 公司 和 Western Electric 公司 于 1925 年 设立 的 研究 开发 机 构 。 














考虑 到 一 部 分 读者 会 有 诸如 “我 对 内 核 源 代码 根本 不 感 兴趣 ”或 者 “与 这 

种 老 古 董 相 比 ， 我 襄 欢 更 现代 的 操作 系统 ”等 看 法 ， 笔 者 想 先 阐述 一 下 
阅读 内 核 源 代码 的 引人入胜 之 处 ,然后 再 解释 UNIX V6 为 何 适合 初次 

接触 内 核 源 代码 的 读者 。 


阅读 内 核 源 代码 的 意义 


我 们 可 以 将 操作 系统 (OS，Operating System) 看 做 是 一 种 软件 〈 集 
合 ) ， 它 对 包括 人 硬件 和 软件 在 内 的 计算 机 系统 的 各 个 部 分 进行 管理 ， 并 
为 用 户 提 供 便 于 使 用 的 操作 界面 。 内 核 作 为 操作 系统 的 核心 部 分 ,提供 
计算 机 系统 必 备 的 功能 ， 因 此 也 被 称 为 狭义 的 操作 系统 。 例 如 ，shell 
之 类 的 程序 通常 不 是 内 核 的 一 部 分 ， 而 是 利用 内 核 提 供 的 功能 来 实现 
内 核 以 外 的 程序 通常 被 称 为 用 户 空间 (userland) 程序 ， 或 用 户 程 
Ye 


通过 阅读 并 理解 内 核 源 代码 ， 我 们 会 有 如 下 收获 。 

对 计算 机 系统 的 全 貌 有 更 深入 的 了 解 

掌握 了 作为 计算 机 系统 核心 部 分 的 内 核 ， 不 仅 对 操作 系统 ， 对 计算 机 的 
全 貌 也 会 有 更 为 深入 的 认识 。 对 通过 大 学 课程 或 其 他 途径 学 习 的 各 种 
mu OPES 的 关联 性 也 会 有 更 清晰 的 认识 ,让 人 有 本 一 
灌顶 的 感觉 。 


让 操作 计算 机 成 为 一 种 令 人 愉快 的 体验 








理解 了 计算 机 系统 的 全 貌 ， 操 作 计 算 机 本 里 也 会 变 得 更 加 令 人 愉快 。 比 
如 ， 在 计算 机 上 执行 某 个 程序 的 时 候 ， 如 果 能 够 准确 把 握 系统 内 部 所 进 
行 的 操作 ， 是 不 是 一 件 很 令 人 兴奋 的 事情 呢 ? 这 种 体验 将 加 深 读 者 对 计 
算 机 的 兴趣 ,使 读者 更 有 动力 去 提高 自己 的 技术 水 平 。 


加 深 对 知识 的 理解 


阅读 代码 与 否 ， 对 知识 的 理解 程度 会 有 云 泥 之 差 。 如 果 只 学 习 了 概要 ， 
既 容 易 遗 筷 也 难以 应 用 。 相 反 ， 理 解 代码 能 够 使 你 对 学 到 的 算法 和 思 
路 举一反三 ,使 之 成 为 可 以 受用 一 生 的 财富 。 


提升 技术 人 员 自 喘 的 水 平 


作为 计算 机 行业 的 技术 人 员 ， 阅 读 并 理解 了 内 核 源 代码 有 助 于 在 专业 领 
域 里 将 目 己 提升 到 一 个 新 的 层次 。 尽 管 在 全 球 范 围 内 这 个 领域 的 从 业者 
不 断 增 加 ， 但 是 在 了 解 应 用 层面 的 同时 ， 对 操作 系统 等 底层 的 知识 也 
有 所 了 解 ,并 且 能 够 对 系统 做 出 整体 优化 的 技术 人 员 , 仍 是 凤毛麟角 。 


但 是 恰恰 是 具备 这 种 素质 的 人 ， 才 能 在 第 一 线 发 挥 不 可 蔡 代 的 作用 。 如 
果 想 拉 大 与 竞争 对 手 的 差距 ,是 必须 理解 系统 内 核 的 。 


为 何 选择 UNIX V6 


接 下 来 想 说 明 一 下 为 什么 不 选择 最 新 的 操作 系统 ， 而 将 历史 比较 悠久 的 
UNIX V6 作为 本 书 的 题材 。 


代码 行 数 约 为 1 万 行 


UNIX V6 的 内 核 源 代码 包括 设备 驱动 程序 在 内 约 有 1 万 行 ， 这 个 数量 
的 源 代码 ， 初 学 者 是 能 够 充分 理解 的 。 有 一 种 说 法 是 一 个 人 所 能 理解 的 
代码 量 上 限 为 1 万 行 ，UNIX V6 的 内 核 源 代码 从 数量 上 看 正好 在 这 个 
范围 之 内 。 看 到 这 里 ， 大 家 是 不 是 也 有 “如 果 只 有 1 万 行 的 话 没准 儿 我 
也 能 学 会 ”的 想法 呢 ? 


另 一 方面 ， 最 近 的 操作 系统 ， 例 如 Linux 最 新 版 的 内 核 源 代码 据说 超过 
了 1000 万 行 “。 就 算 不 是 初学 者 ， 想 完全 理解 全 部 代码 基本 上 也 是 不 可 






































?http://www.h-online.com/open/features/Kernel-Log-15-000-000-lines-of-code-3-0-promoted-to- 
long-term-kernel-1408062.html . 


充实 的 资料 


UNIX V6 的 用 户 手 册 、 相 关 资 料 和 论文 都 可 以 在 网 上 找到 。 运 行 UNIX 
V6 duh 的 处 理 装置 PDP-11 以 及 周边 设备 的 设计 文档 ， 很 大 一 部 分 也 可 
以 检索 到 。 


另外 ， 有 一 本 关于 UNIX V6 的 指南 已 经 问世 多 年 。 此 书 名 为 《 莱 昂 氏 
UNIX 源 代码 分 析 》  CLions' Commentary on UNIX， 机 械 工 业 出 版 社 出 
版 ) ， 由 澳大利亚 新 南 威尔士 大 学 的 约翰 . 莱 晶 〈John Lions) 教授 撰 

写 ， 也 被 称 为 Lions ® (Lions Book) BB3。 这 本 书 由 于 UNIX 的 版 权 问 
题 ， 据 说 当时 只 能 在 学 生 之 间 私 下 传 看 ， 后 来 才 广泛 地 流传 开 来 ， 现 在 
可 以 从 网 上 免费 下 载 由 。Lions 书 对 本 书 中 基本 没有 涉及 的 PDP-11/40 
ea 了 部 分 说 明 ， 与 本 书 配合 使 用 会 有 更 好 的 效 


3 本 书 中 以 [数字 ] 形式 标注 的 部 分 在 书 尾 附 录 中 有 相对 应 的 内 容 。 





























4 同时 审 校 者 推荐 《UNIX 操作 系统 教程 》， 西 安 电子 科技 大 学 出 版 社 于 1985 年 6 月 出 版 ， 尤 
晋 元 主编 。 这 是 一 本 详细 剖析 UNIX V6 机 制 和 源码 的 教材 。 一 一 审 校 者 注 


网 多 了 操作 系统 的 基本 功能 


UNIX V6 虽然 比较 老 ， 但 是 它 实现 了 构成 操作 系统 的 大 部 分 基本 功能 
。 目 前 最 新 的 操作 系统 大 部 分 都 是 以 它 为 基础 发 展 而 来 的 ， 因 此 以 
UNIX V6 为 入 门 教材 对 我 们 了 解 最 新 的 操作 系统 来 说 会 很 有 帮助 。 


线程 、 网 络 、GUI、 多 核 文 持 、 虚 拟 机 等 这 些 UNIX V6 不 具备 的 功能 
在 近 些 年 的 操作 系统 中 得 以 实现 。 这 些 功 能 当中 有 很 多 其 实 是 以 UNIX 
V6 实现 的 功能 为 基础 的 。 


简化 的 设计 
UNIX V6 作为 一 种 早期 的 操作 系统 ， 功 能 实现 比较 简单 。 而 最 新 的 操 


作 系 统 要 顾及 更 多 的 问题 ， 同 时 也 要 考虑 到 性 能 的 优化 ， 因 此 实现 也 更 
为 复 保 。 如 果 是 首次 阅读 内 核 源 代码 ,用 相对 简单 的 UNIX V6 更 合适 。 





c 


























便于 读者 对 系统 有 完整 的 了 解 


前 面 已 经 说 过 ， 从 代码 量 上 看 ， 通 读 UNIX V6 内 核 源 代码 对 个 人 来 说 
是 可 以 做 到 的 。 如 果 更 进一步 ， 对 系统 内 置 的 用 户 程 序 集 ( 如 shell). 的 
代码 或 是 周边 设备 的 设计 文档 也 有 所 涉 猫 的话， 就 会 对 包括 内 核 在 内 的 
计算 机 系统 整体 有 更 深入 细致 的 了 解 。 上 述 系统 内 置 的 用 户 程序 集 的 
代码 或 设计 文档 与 最 新 产品 相 比 ， 在 实现 上 更 为 简单 ， 也 更 容易 理解 。 


有 模拟 器 可 供 参 考 


simh"! 这 款 模拟 器 能 够 模拟 包括 PDP-11 系列 的 许多 处 理 器 ， 可 以 用 来 
运行 UNIX V6。 因 此 在 阅读 源 代码 时 可 以 随时 通过 模拟 器 确认 不 太 明 
白 的 地 方 。 在 simh 上 运行 UNIX V6 的 方法 请 参考 附录 A.1 的 [8]、[21] 
和 [22]。 


儿 个 难点 


当然 ，UNIX V6 也 存在 它 特 有 的 问题 。UNIX V6 的 大 部 分 代码 使 用 了 
C 语言 编写 ， 而 当时 的 C 语言 还 处 于 初期 阶段 ， 在 语法 规格 上 与 现在 的 
C 语言 有 所 不 同 〈 顺 便 提 一 下 ，C 语言 就 是 因为 编写 UNIX 才 诞 生 
的 ) 。 当 时 的 C 语言 使 用 K&R? 之 前 的 语法 ， 因 此 也 被 称 为 pre K&R- 
请 看 下 面 的 例子 〈 代 码 清单 1 ) 。 

5 这 里 指 的 是 C Programming Language 这 部 讲述 C 语言 的 名 著 (Brian W. Kernighan, Dennis 


M. Ritchie G) 。 根 据 两 位 作者 姓氏 的 首 字母 ， 此 书 也 被 称 为 K&R， 中 文 版 书 名 是 《C 程序 
设计 语言 》， 由 机 械 工业 出 版 社 出 版 。 一 一 译 者 注 


















































代码 清单 1 当时 的 C 语言 的 示例 


struct ( 
char high; 
char low; 


E 


hogehoge(arg) { 
int hoge; 
hoge - arg; 
return hoge-»low; 


ej 


1 
2 
3 
4 
5 
6 
7 
8 
9 
1 





估计 会 有 读者 提出 “为 什么 函数 hogehoge() 没有 定义 返回 值 和 参 
数 "、“ 为 什么 对 int 型 的 hoge! 可 以 使 用 hoge-» 这 样 的 写法 ”等 疑 
问 。 这 是 由 C 语言 当时 的 语法 决定 的 。 











8hoge 以 及 后 文中 出 现 的 fuga 等 是 日 语 中 经 常 使 用 的 伪 变 量 名 ， 类 似 于 英语 中 的 
foo、bar。 译 者 注 








虽然 存在 这 种 语法 上 的 差异 ， 但 pre K&R C 的 语法 规格 说 明 书 HS a eA 
在 网 上 获取 ， 而 且 如 果 是 了 解 当代 C 语言 的 读者 ， 应 该 不 会 很 难 理 
解 。 而 比较 特殊 的 pre K&R C 语法 ， 请 参考 本 书 的 附录 。 


另外 ， 和 其 他 很 多 程序 一 样 ，UNIX V6 的 一 部 分 代码 采用 了 汇编 语言 
来 编写 。 这 对 首次 接触 汇编 语言 的 读者 来 说 可 能 会 有 影响 。 但 是 ， 
UNIX V6 使 用 的 PDP-11 (参考 第 1 章 ) 的 汇编 语言 的 规格 说 明 书 [171 
也 可 以 在 网 上 找到 ， 慢 慢 熟 悉 就 会 适应 了 。 


面向 的 读者 


本 书 主 要 面向 计算 机 专业 的 学 生 ， 以 及 从 事 计 算 机 相关 行业 的 具有 初中 
级 水 平 的 技术 人 员 。 特 别 适 合 那些 通过 大 学 读 程 和 其 他 入 门 书 对 操作 
系统 有 所 了 解 ,但 是 对 具体 细节 缺乏 深入 理解 的 读者 ， 或 是 那些 对 操作 
系统 的 具体 实现 有 兴趣 的 读者 。 


需要 具备 的 知识 基础 


UNIX V6 内 核 的 大 部 分 代码 部 是 用 C 语言 写成 的 ， 因 此 读者 必须 具备 
C 语言 的 知识 基础 ， 也 要 掌握 栈 、 队 列 等 基本 数据 结构 和 算法 的 知 
识 。 男 外 ， 如 果 能 了 解 计算 机 的 运行 原理 ， 比 如 程序 在 执行 时 需要 首先 
加 载 到 内 存 ， 然 后 从 程序 计数 涡 指 定 的 由 仔 地 址 读 取 指令 全 ， 吕 更 为 理 
ABT. 








对 那些 完全 不 了 解 操 作 系 统 的 朋友 来 说 ， 本 书 的 难度 可 能 有 点 大 。 建 议 
先 参考 在 本 书 附录 部 分 介绍 的 入 门 书籍 (附录 A.1 中 的 [5] 和 [6]) ， 等 
0 edendis ed 
I 效果 。 


本 书 的 结构 





第 1 章 介 绍 UNIX V6 的 整体 概要 。 

第 2 章 到 第 4 章 介 绍 用 来 管理 程序 运行 的 进程 Cprocess) . 28 2 童 概述 
进程 。 第 3 章 说 明 进 程 的 控制 方法 。 第 4 章 说 明 以 有 效 利 用 有 限 内 存 空 
间 为 目的 的 交换 (swap) 处 理 。 

7B 5 章 和 第 6 章 介 绍 因 某 种 事项 中 断 当 前 进程 运行 ， 并 转 而 处 理 该 事项 
的 几 种 机 制 。 第 5 章 首先 介绍 如 何 处 理 周 边 设 备 和 CPU 内 部 发 生 的 中 
断 请 求 。 然 后 介绍 了 系统 调用 Csystem cal) ， 系 统 调用 是 利用 中 断 请 
求 来 连接 用 户 程 序 和 内 核 的 机 制 。 第 6 章 主要 介绍 信号 〈signal) ， 信 
号 用 于 实现 进程 间 通 信 ， 会 引起 处 理 的 中 断 或 使 处 理 内 容 发 生变 化 。 


第 7 章 和 第 8 章 介 绍 磁盘 等 设备 的 10 处 理 。 第 7 章 说 明 块 (block) 设 
备 子 系统 ， 第 8 章 说 明 块 设备 驱动 程序 。 


第 9 章 和 第 10 章 对 文件 系统 进行 说 明 。 文 件 系统 隐藏 了 块 设备 的 存储 
细节 ， 癌 用 户 提 供 访问 数据 的 统一 方法 。 第 9 章 介 绍 文件 系统 的 概要 ， 
第 10 章 对 文件 的 操作 加 以 说 明 。 

第 11 章 介绍 用 来 实现 进程 间 数 据 通信 的 管道 (pipe) 。 

第 12 章 介 绍 行 式 打印 机 的 UO 处 理 。 

第 13 章 介绍 终端 处 理 。 终 端 处 理 使 用 户 能 够 以 会 话 的 方式 操作 系统 。 
第 14 章 说 明 系 统 的 启动 处 理 。 

内 核 的 整体 结构 和 各 章 之 间 的 对 应 关系 如 图 1 所 示 。 



































用 户 程序 


p^ 第 5 章 ~, 


系统 调用 ) 





图 1 内 核 整 体 结 


上 述 章节 是 根据 笔者 认为 在 阅读 UNIX V6 内 核 源 代码 时 应 该 遵循 的 顺 
序 而 编排 的 ， 将 读者 可 能 更 感 兴 趣 的 有 关 进 程 和 文件 系统 的 内 容 尽量 安 
排 在 前 半 部 分 ， 其 他 的 内 容 则 安排 在 后 半 部 分 。 另 外 ， 在 阅读 各 章 时 所 


需 的 知识 ， 尺 量 在 前 面 的 章节 中 加 以 说 明 。 
关于 本 书 的 说 明 


因为 篇 幅 有 限 ， 所 以 本 书 以 介绍 内 核 的 基本 处 理 过 程 为 主要 目的 ， 对 
比较 少见 的 处 理 和 异常 处 理 没 有 进行 特别 细致 的 说 明 。 此 外 ， 本 书 从 所 
有 代码 中 挑选 出 比较 重要 的 部 分 〈 占 所 有 代码 的 70%~80%) ， 省 略 不 
是 很 重要 的 部 分 或 非常 简单 无 需 说 明 的 代码 。 对 用 汇编 语言 编写 的 内 

容 ， 本 书 只 介绍 了 启动 处 理 和 上 下 文 切换 处 理 。 本 书 中 没有 介绍 的 代码 
希望 读者 能 够 自己 去 分 析 理 解 。 

另外 ， 考 虑 到 相关 内 容 已 经 在 本 书 中 加 以 说 明 ， 因 此 在 登载 的 代码 中 删 
除了 UNIX V6 开发 者 加 入 的 注释 。 但 是 为 了 提高 可 读 性 ， 笔 者 还 是 保 
留 了 一 部 分 原 注 释 ， 同 时 也 加 入 了 一 部 分 新 的 注释 。 

本 书 旨 在 成 为 UNIX V6 内 核 源 代码 的 阅读 指南 。 如 果 想 完全 理解 内 核 
细节 ， 仅 阅读 本 书 的 说 明 部 分 是 不 够 的 ， 还 需要 深入 理解 书 中 涉及 的 甚 
至 未 涉及 的 代码 。 

关于 代码 的 说 明 


c RUNE anite Ru LM T RUNNING 
行 讲解 。 


. 讲解 进程 或 文件 系统 等 功能 
. 讲解 实现 上 述 功能 的 函数 或 结构 体 
.给 出 上 述 函 数 或 结构 体 的 代码 并 讲解 


为 了 便于 读者 阅读 ， 本 书 按照 下 述 格 式 讲解 代码 。 根 据 需 要 ， 在 有 些 地 
方 调整 了 代码 和 表格 的 讲解 顺序 。 


结构 体 的 讲解 
内 核 中 定义 了 一 些 重要 的 结构 体 ， 用 表格 的 形式 介绍 结构 体 的 成 员 代 


人 
文件 名 。 











A 


NJ 


UJ 





zl 


讲解 的 过 程 统 一 采用 “结构 体 名 . 成 员 ” 的 形式 表示 某 个 构造 体内 的 成 


Uo 


代码 清单 2 结构 体 示例 (文件 名 ) 


1 struct hoge | 包含 结构 体 的 文件 名 
2 int aaa; 
char bbb; 


[e 

ou Char Cec; 
LE char *ddd; 
E: 
Im 


int eee [3]; 


bbb 的 讲解 


ccc 的 讲解 
ddd 的 讲解 


eee 的 讲解 








函数 的 讲解 


首先 以 表格 的 形式 讲解 参数 〈 表 2 ) ， 然 后 给 出 代码 和 每 行 的 讲解 〈 代 
码 清单 3 ) 。 在 代码 清单 标题 的 括 弧 中 ， 注 明了 定义 该 函数 的 文件 名 。 
里 然 此 处 的 例子 对 每 行 代码 都 做 了 详细 〈 其 实 没 有 必要 ) 的 说 明 ， 但 如 





果 代码 本 身 是 无 需 解 释 的 ， 或 事先 已 做 过 介绍 ， 那 么 在 代码 清单 中 就 不 
会 再 做 特别 说 明 。 


表 2 函数 参数 示例 


EMEN NEM 








代码 清单 3 ”函数 示例 《文件 名 ) 





hogehoge(fuga) | 
int a, b; 
em Ux 


di 

2 

3 

4 bez Pudgs de € 
LE return b; 
S 





3-5 返回 参数 fuga 与 10 相 加 的 结 


对 汇编 语言 代码 也 以 相同 的 方式 说 明 。 因 为 本 书 省 略 了 对 汇编 器 规格 的 
说 明 ， 所 以 如 果 有 读者 需要 简单 确 认 PDP-11 指 令 集 ， 请 见 附录 A.1 的 
[9]， 需 要 了 解 汇编 器 详细 信 ， 和 的 读者 详 见 附录 AI 的 [20]。 


栈 的 说 明 

在 涉及 进程 拥有 的 栈 状 态 时 将 用 表格 加 以 说 明 (E 30 。 在 第 2 章 中 会 
提 到 ， 各 进程 的 栈 是 从 地 址 空间 的 最 高 位 开始 分 配 ， 癌 低位 方向 增长 。 
但 是 在 表格 里 位 于 上 方 的 行 表示 较 低 位 的 地 址 ， 也 束 是 说 栈 在 表格 里 是 
由 下 向 上 增长 的 。 


表 3 栈 的 示例 





处 于 栈 顶 端 第 2 位 的 值 








寄存 器 


在 涉及 PDP-11 或 周边 设备 的 寄存 器 时 将 用 表格 加 以 说 明 《〈 表 4 ) 。 
未 使 用 的 比特 位 不 做 介绍 


KA Wa 





在 讲解 中 如 果 雷 要 调用 寄存 器 的 某 一 位 ， 比 如 说 第 0 位 的 时 候 ， 会 


以 “寄存 器 名 [0]” 的 形式 标注 。 如 果 调 用 了 多 个 比特 位 ， 比 如 说 从 第 3 


位 到 第 1 位 的 时 候 ， 会 以 “寄存 此 名 [3-1]” 的 形式 标注 。 
数字 的 表示 形式 


对 


UNIX V6 中 有 很 多 地 方 采 用 了 八进制 数 。 为 了 避免 混 消 基 数 ， 在 介绍 








中 采用 了 如 下 的 表示 形式 。 
。 十 六 进 制 数 : Ox10 


e 十 进 制 数 : 16 
e 八进制 数 : 020 


对 二 进 制 数 则 直接 采用 01 或 10 的 形式 表示 。 尽 管 十 进 制 数 和 八进制 数 
的 表示 形式 比较 相似 ， 容 易 混 消 ， 但 相信 读者 通过 上 下 文 还 是 可 以 区 分 








另外 请 注意 ，PDP-11 的 汇编 器 对 不 带 前 级 的 数字 一 律 按 八进制 数 处 
e 


儿 扣 有 助 于 增进 理解 的 建议 


UNIX V6 内 核 源 代码 尽管 比较 适合 初次 阅读 代码 的 读者 ， 但 是 仍然 有 
一 定 的 难度 。 笔 者 在 此 举 出 几 点 便于 读者 增进 理解 的 建议 ， 在 阅读 代码 
遇 到 困难 时 请 酌情 参考 。 


首先 通读 全 书 


首先 请 从 头 到 尾 通 读本 书 ， 和 营 握 内 核 的 人 全貌 。 在 理解 茶 个 模块 的 代码 
时 ， 往 往 需要 对 相关 模块 有 所 了 解 。 前 面 已 经 说 过 ， 在 编排 章节 时 我 尽 
量 将 相关 内 容 靠 前 说 明 ， 但 是 这 种 做 法 毕竟 还 是 有 局 限 性 的 。 在 阅读 中 
遇 到 难于 理解 的 内 容 时 ， 可 以 移 跳 过 它 ， 等 到 读 完 全 书后 再 重读 这 一 部 
分 ， 这 可 能 是 一 个 比较 好 的 办 法 。 


阅读 规格 说 明 书 和 程序 员 手 册 


在 阅读 本 书 的 同时 ， 阅 读 规格 说 明 书 和 程序 员 手 册 有 助 于 加 深 理 解 。 不 
要 通过 阅读 代码 去 理解 程序 规格 ,而 应 该 在 理解 规格 的 基础 上 再 去 阅读 
代码 。 特 别 是 系统 调用 部 分 的 规格 非常 重要 。 内 核实 现 了 最 低 限 度 的 功 
能 ， 而 这 些 功能 是 通过 系统 调用 提供 给 用 户 程 序 的 ， 从 这 个 角度 上 说 ， 
将 系统 调用 的 规格 看 作 是 内 核 的 规格 也 并 不 过 分 。 

在 阅读 设备 驱动 程序 时 ， 最 好 也 读 一 下 该 设备 的 规格 说 明 书 。 设 备 驱 动 
程序 是 根据 设备 规格 进行 操作 的 ， 理 解 了 设备 规格 后 ， 对 理解 驱动 程序 
进行 的 操作 无 疑 会 有 帮助 。 


仔细 阅读 结构 体 














包括 系统 内 核 在 内 ， 程 序 的 主要 工作 就 是 操作 数据 。 因 此 ， 只 要 把 握 了 
作为 处 理 对 象 的 结构 体 ， 或 是 程序 中 出 现 的 标志 变量 Clag), MAER 
致 推测 出 该 程序 的 处 理 内 容 。 


区 分 内 存 空间 地 址 


代码 中 涉及 内 存 地 址 的 部 分 ， 请 注意 区 分 该 地 址 指向 的 是 内 核 的 地 址 空 
间 ， 还 是 用 户 程序 的 地 址 空间 。 


寻找 志同道合 的 朋友 


在 阅读 本 书 、Lions 书 ， 或 是 UNIX V6 内 核 源 代码 的 时 候 ， 组 织 读书 会 
是 一 个 很 好 的 方法 。 向 他 人 提出 自己 的 疑问 ， 或 是 向 他 人 介绍 自己 理解 
的 内 容 ， 这 都 会 加 深 对 内 容 的 理解 。 在 博客 上 写 出 自己 的 想法 和 心得 也 
是 二 个 很 好 的 方法 。 


本 书 的 写作 原委 和 谢 群 


在 写本 书 之 前 ， 笔 者 对 操作 系统 的 大 概 情况 有 一 定 认 识 ， 但 是 完全 不 了 

解 具 体 的 实现 方法 ， 总 希望 有 机 会 能 阅读 一 下 源 代 码 。 通 过 朋友 的 介绍 

接触 到 Lions' Commentary on UNIX 这 本 书 〈 也 就 是 通称 的 Lions È) ， 

aa aa 
了 兴趣 。 


但 是 ，Lions 书 问 世 已 入， 写作 的 时 代 背 景 和 现在 相差 迎 异 ， 因 此 对 我 
而 言 很 难 理解 ， 阅 读 速 度 非 常 缓慢 。 此 时 ， 又 是 前 面 提 到 的 那 位 朋友 向 
我 介绍 了 一 个 关于 Lions 书 的 读书 会 ， 我 就 参加 了 他 们 的 读书 活动 。 在 
读书 会 里 ， 通 过 请 教 对 内 核 比 较 熟 悉 的 成 员 ， 或 是 向 他 人 介绍 自己 通过 
预习 而 掌握 的 知识 ， 慢 慢 加 深 了 对 UNIX V6 内 核 的 理解 。 


理解 了 系统 内 核 之 后 ， 我 上 学 时 学 到 的 计算 机 相关 知识 之 间 的 联系 就 在 
头脑 中 逐渐 清晰 起 来 ， 同 时 也 切实 体会 到 自己 在 这 个 领域 的 造 讶 明显 地 
提高 了 一 个 层次 。 

为 了 和 他 人 分 享 这 种 体验 ， 同 时 也 作为 学 习 的 备 筷 录 ， 我 开始 在 博客 上 
记录 学 习 过 程 。 读 完了 Lions 书后 ， 博 客 的 连载 也 告 一 段落 后 ， 我 写 了 
一 篇 总 结 性 的 文章 ， 引 起 了 很 大 反 啊 。 



































当 我 确信 读者 对 类 似 系统 内 核 这 种 《与 应 用 程序 相 比 较 ) 底层 的 知识 有 
很 大 需求 之 后 ， 便 主动 网 出 版 社 毛 遂 目 存 ， 丙 谈 以 博客 文章 为 基础 出 版 
图 书 的 事宜 ， 得 到 了 技术 评论 社 ”的 积极 回应 。 














7 本 书 原著 的 出 版 社 。 一 一 译 者 注 








本 书 以 笔者 一 人 的 微薄 之 力 古 难以 完成 的 。 如 果 没 有 参加 读书 会 ， 是 否 
能 坚持 读 完 Lions 书 都 是 一 个 问题 。 借 此 机 会 对 读书 会 的 各 位 成 员 表 示 
感谢 。 


读书 会 成 员 大 野 徽 先生 、 小 泽 广 先生 、 匠 项 佑 树 先 生 、 高 野 了 成 先生 、 
丰 岛 隆 志 先生 、 七 志 先生 、 浜 田 直 树 先生 、 细 川 生 人 先生 、 松 泽 裕 先 生 
和 山本 英雄 先生 参与 了 本 书 的 审阅 工作 ， 为 笔者 提出 了 很 多 中 肯 的 意 
见 。 一 想到 如 果 没 有 这 些 意见 的 话 呈 现在 读者 面前 的 将 会 是 怎样 一 本 
， 不 免 有 些 后 介 。 正 是 因为 大 家 的 帮助 ， 本 书 的 品质 得 到 了 很 大 提 
， 我 从 此 机 会 表示 感谢 。 





at E 


小 结 


阅读 内 核 源 代码 ， 可 以 提高 自身 的 技术 水 平 ， 加 深 对 计算 机 的 兴趣 


UNIX V6 的 历史 相对 悠久 ， 但 是 比较 适合 初次 阅读 内 核 源 代码 的 
读者 

在 理解 规格 说 明 书 和 手册 的 基础 上 ， 重 复 阅 读本 书 和 内 核 源 代码 将 
会 加 深 理 解 


寻找 志同道合 的 朋友 十 分 重要 


第 I 部 分 什么 是 UNIX V6 
在 具体 介绍 代码 之 前 ,首先 会 讲解 UNIX V6 的 一 些 基本 概念 。 
e UNIX V6 内 核 具 有 哪些 功能 
。 内 核 如 何 向 用 户 程序 提供 功能 
e 运行 UNIX V6 的 系统 由 怎样 的 硬件 构成 
了 解 了 上 述 概念 ,对 理解 内 核 源 代码 一 定 会 有 帮助 。 


第 1 童 UNIX V6 HASH 


1.1 什么 是 UNIX V6 


UNIX V6H1 Fi 323535 (Kenneth Lane Thompson) 和 丹尼斯 :里 奇 
(Dennis MacAlistair Ritchie) 开发 ， 由 贝尔 实验 室 于 1975 年 发 布 。 


因为 大 部 分 代码 都 是 用 C 语言 完成 的 ， 并 且 公 开 了 源 代 码 ， 所 以 包括 大 
学 在 内 的 使 用 者 纷纷 将 其 移植 到 目 己 的 环境 中 ，UNIX V6 因此 得 到 广 
泛 使 用 。 在 移植 过 程 中 ， 有 些 开 发 人 员 加 入 了 独 有 的 功能 ， 其 中 一 些 功 
能 后 来 也 被 原始 版 本 所 采纳 。 


从 UNIX V6 派生 出 来 的 产品 还 有 很 多 ， 但 是 本 书 以 其 原始 版 本 , 即 在 
DEC 公司 的 PDP-11/40 设备 上 运行 的 系统 内 核 作 为 说 明 对 象 。 








1.2 UNIX 的 历史 


贝尔 实验 室 在 发 布 UNIX V6 之后， 于 1979 年 又 发 布 『 UNIX 第 7 版 

(Seventh Edition Unix; UNIX V7 ) 。 加 州 大 学 伯克利 分 校 于 1978 年 
发 布 了 以 UNIX V6 为 基础 的 BSD 的 首 个 版 本 。 在 此 之 后 ，UNIX 和 
BSD 不 断 有 新 版 本 或 派生 版 本 出 现 。 然 后 又 出 现 了 标准 化 的 动身， 制定 
了 POSIX 标准 ， 意 在 统一 各 个 操作 系统 所 提供 的 API。 著 名 的 Linux 也 
是 将 POSIX 标准 作为 开发 目标 的 。 因 此 ， 大 多 数 最 新 的 操作 系统 都 和 
UNIX (V6 ) 有 者 干 丝 万 缕 的 联系 。 


UNIX 的 历史 如 图 1-1 所 示 。 
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图 片 Eraserheadl, Infinity0 (Own work: CC-BY-SA-3.0, GFDL) 
图 11 UNIX 的 历史 1 


| lhttp://ja.wikipedia.org/wiki/UNIX 


1.3 UNIX V6 内 核 
UNIX V6 内 核 提供 了 这 些 操作 系统 所 必须 具备 的 如 下 基本 功能 : 
。 管 理 运行 中 的 程序 (进程 ) 

。 内 存 管理 

。 文 件 系统 

。 文 件 和 周边 设备 共享 VO 

e diii 

。 支 持 终端 处 理 


内 核 癌 用 户 提供 了 经 过 高 度 抽象 的 服务 。 系 统 对 CPU 或 磁盘 的 操作 细 
市 被 内 核 或 设备 驱动 程序 隐藏 起 来 ， 对 用 户 完 全 透明 。 


用 户 程序 通过 系统 调用 机 制 访问 内 核 提 供 的 功能 。 构 成 计算 机 系统 的 软 
件 集 合 如 图 1-2 所 示 。 应 用 程序 利用 UNIX V6 提供 的 系统 内 置 的 用 户 
程序 集 〈 处 理 用 户 登 录 的 程序 ， 或 是 守护 程序 等 ) 、 辅 助 程序 (例如 
ls. cat 等 ) 、 程 序 库 等 进行 处 理 。 系 统 程序 等 则 利用 系统 调用 (调用 
pum 进行 自身 的 处 理 。 此 外 ， 应 用 程序 也 可 以 直接 使 用 系 
统 调 用 。 

















调用 程序 库 函 数 、 应 用 程序 


执行 命令 





图 1-2 构成 UNIX V6 的 软件 集合 


内 核 集中 了 对 系统 影响 较 大 的 处 理 ， 通 过 限制 用 户 任 意 执行 这 些 功 能 ， 
使 系统 的 安 全 性 和 可 维护 性 得 以 保证 。 


1.4 ”构成 UNIX V6 运行 环境 的 硬件 


本 节 对 构成 UNIX. V6 运行 环境 的 硬件 进行 介绍 。 这 里 说 明 的 内 容 将 贯 
穿 以 后 的 各 章 ， 请 读者 注意 理解 。 











PDP-11 


PDP-11 系列 是 由 数字 设备 公司 (Digital Equipment Corporation, 
DEC) °? 设计 制造 的 处 理 装 置 。 本 书 内 容 以 PDP-11/40 为 对 象 〈 图 1-3 
) 。 








| ?美国 计算 机 企业 。 于 1998 年 被 康 柏 公司 Compaq) 收购 ， 随 后 康 柏 公司 又 与 惠普 公司 
| (Hewlett Packard) 合并 。 














照片 : Stefan. Kógl ( GFDL) 


[d] 1-3 PDP-11/40? 


3http://ja.wikipedia.org/wiki/PDP-11 


PDP-11/40 作为 一 种 16 位 计算 机 ， 指 令 和 数据 基本 都 是 以 16 比特 为 单 
位 进行 处 理 的 。 处 理 器 处理 数 据 的 单位 称 为 字 Cword) 。 对 PDP-11/40 
而 言 ,1 个 字 的 宽度 为 16 比特 。 


PDP-11/40 没有 专用 的 IO 总 线 ， 而 是 使 用 一 种 名 为 Unibus 的 总 线 用 于 
数据 的 输入 输出 ，Unibus 同时 具有 18 比特 宽 的 地 址 总 线 4。PDP-11/40 
以 及 周边 设备 的 寄存 器 被 映射 到 内 存 最 高 位 的 8KB 空间 ， 因 此 可 以 采 
用 与 操作 内 存 相 同 的 方法 操作 寄存 器 。 这 种 方式 被 称 为 内 存 映 射 

I/O (Memory Mapped UO) (图 1-4) 。 














^Unibus 总 线 共有 72 条 信号 线 ， 其 中 有 18 条 用 于 传输 地 址 (地 址 总 线 ) ， 另 有 16 条 用 于 传 
| 输 数据 (LO 总 线 ) 。 一 一 译 者 注 








内 存 地 址 
0 





Unibus 


设备 的 寄存 器 被 映射 到 内 存 最 高 位 的 
8KB 空 间 。 通 过 操作 内 存 来 达到 访问 
寄存 器 的 目的 ( 内 存 映射 VO ) 


图 1-4 通过 Unibus 进行 连接 的 设备 


利用 内 存 映 射 O， 可 以 用 C 语言 将 寄存 器 的 操作 写成 如 代码 清单 1-1 
所 示 的 形式 。integ 的 含义 请 参见 本 书 的 附录 。 


代码 清单 1-1 寄存 器 的 操作 示例 


/* 寄存 器 被 映射 的 地 址 */ 
#define REG ADDRESS 0170000 


struct ( 
int integ; 


}; 
main() { 


int a; 
a = REG ADDRESS-»integ; /* 从 寄存 器 读 取 数据 */ 
REG ADDRESS-»integ = 0; /* 向 寄存 器 写 入 数据 */ 








PSW 


PDP-11/40 拥有 一 个 被 称 为 处 理 器 状态 字 (Processor Status Word, 
PSW) 的 16 位 的 寄存 器 CK 1-1 ) 。PSW 表示 处 理 器 的 状态 。 


表 1-1 PSW 


比特 位 
里 器 当前 模式 C00: 内 核 模式 、11 : 用 户 模式 ) 


处 理 器 先前 模式 (00 : 内 核 模式 、11 : 用 户 模式 ) 






























































EIN 
N. 令 执行 结果 为 负 时 置 1 








。 零 位 。 指 令 执行 结果 为 0 时 置 1 











1 V。 洲 出 位 。 指 令 执 行 中 发 生 洲 出 时 置 1 











。 借 位 位 。 指 令 执行 中 发 生 进位 或 借 位 时 置 














处 理 器 模式 为 00 时 表示 内 核 模式 ， 为 11 时 表示 用 户 模式 ?。 在 对 系统 
调用 等 进行 处 理 时 ， 处 理 器 需要 首先 从 用 户 模 式 切 换 到 内 核 模 式 。 内 核 
模式 和 用 户 模式 所 使 用 的 进程 的 虚拟 地 址 空间 是 相互 独立 的 ， 因 此 在 两 
种 模式 间 传 输 数 据 时 ， 需 要 了 解 处 理 器 当前 模式 和 处 理 圳 先前 模式 。 


























5 在 一 些 资料 中 , “内核 模式 ”也 译 为 “核心 态 ”，“ 用 户 模式 ”也 译 为 < 用户 态 ”。 一 一 审 校 者 注 


PSW[3-0] 会 根据 指令 的 执行 结果 自动 设置 。 关 于 处 理 器 优先 级 和 陷入 
位 将 在 第 5 章 做 详细 说 明 。 


通用 寄存 器 

PDP-11 具有 r0—17 共 8 个 通用 寄存 器 。 其 中 只 有 6 为 两 个 ， 分 别 对 应 
用 户 模 式 和 内 核 模 式 。 在 切换 PSW 的 当前 模式 时 ,r6 在 硬件 上 也 会 自 
动 切换 。 

UNIX V6 通用 寄存 器 的 用 途 如 表 1-2 所 示 。 


表 1-2 通用 寄存 器 





























r7 (pe) 程序 计数 器 








EXP r5. r6. r7 对 理解 UNIX V6 内 核 尤 其 重要 
r5 称 为 帧 指针 或 环境 指针 。 在 第 3 章 中 会 做 详细 介绍 
r6 称 为 栈 指针 ， 它 指 同 各 进程 所 拥有 的 栈 的 顶端 


r7 称 为 程序 计数 器 。 处 理 器 从 rz7 指示 的 门 存 地 下 该 取 指令 令 ， 随 后 解释 
并 执行 该 指令 。 处 理 完 成 后 r7 将 指 回 容纳 下 一 条 指令 的 内 存 地 址 。 


MMU 


内 存 管理 单元 MMU，Memory Management Unit) 用 于 地 址 变换 以 及 

访问 权限 管理 。PDP-11/40 以 长 度 为 8KB 的 段 (segment) 或 页 

(page) 为 单位 ， 对 进程 所 需 的 内 存 进行 管理 。 试 图 访问 不 具备 权限 的 
NFI, MMU 会 引发 一 个 陷入 异常 (参见 第 5 章 ) 。MMU 通过 称 为 

APR 的 寄存 器 (页 寄存 器 〉 对 各 上 段 进行 设 定 ， 并 将 虚拟 地 址 转换 为 物理 
地 址 。APR 和 地 址 变换 的 详情 会 在 第 2 章 中 介 


PDP-11/40 的 MMU FUTTER (Status Register SRO 和 
SR2. SRO 用 于 保存 出 错 信 ， 息 和 内 存 管理 的 有 效 标 志 CK 1-3) 。 ,SR2 
用 于 保存 目标 指令 的 16 位 虚拟 地 址 ， 可 用 来 确定 引起 音 误 的 指令 〈 表 
1-4) 。 











表 1-3 SRO 


访问 设 定 错误 的 页 时 置 1 


























访问 由 PDR〔 详 细 请 参见 第 2 3:0 规定 的 页 长 度 以 外 的 区 域 时 置 1 
ik 


8 维护 模式 。 本 书 不 做 详细 说 明 





6^5 出 错 进程 的 模式 C00: PER. 11: 用 户 ) 


页 编号 。 可 用 于 确定 引起 错误 的 内 存 页 











内 目标 指令 的 16 位 虚拟 地 址 。 当 读 取 指令 失败 时 SR2 的 值 不 更 新 。 另 外 ， 
如 果 SRO[15-13] 的 任意 1 位 为 1 时 SR2 的 值 也 不 更 新 














内 存 

PDP-11/40 使 用 的 内 存 被 称 为 磁 忆 内 存 (Magnetic Core Memory) ， 当 
时 的 论文 等 有 时 将 其 称 为 磁 蕊 (Core) ， 本 书 为 了 便于 读者 理解 ， 仍 将 
其 称 为 内 存 。 

内 存 以 8 比特 Ga FZT) 为 单位 赋予 地 址 。 地 址 长 度 为 18 比特 ， 因 此 
内 存 容 量 为 218=256KB。PDP-11/40 将 周边 设备 的 寄存 器 映射 到 内 存 高 
位 8KB 的 地 址 空间 。 

处 理 器 利用 内 存 中 存储 的 指令 和 数据 进行 运算 。 

块 设备 

人 磁盘 设备 或 磁带 设备 等 块 设备 可 以 容纳 大 量 数 据 。 文 件 系统 构筑 于 块 设 
备 之 上 。 对 块 设备 IO 处 理 的 介绍 参见 第 7 章 、 第 8 章 ， 对 文件 系统 的 
详细 说 明 参 见 第 9 章 、 第 10 章 。 


块 设备 的 一 部 分 被 用 做 交换 空间 。 为 了 在 有 限 容量 的 内 存 中 运行 大 量程 




















序 ， 内 核 会 把 不 需要 的 数据 从 内 存 转移 到 交换 空间 ， 或 者 将 需要 的 数据 
空间 移 回 内 存 。 这 被 称 为 交换 处 理 ， 在 第 4 章 中 会 对 此 进行 详细 
说 明 

行 式 打 印 机 


行 式 打印 机 用 于 在 纸张 上 打印 数据 的 设备 。 对 行 式 打印 机 的 说 明 请 见 第 
12 章 。 





终端 


终端 是 连接 系统 与 用 户 的 装置 。 用 户 可 以 通过 终端 对 系统 进行 交互 式 的 
操作 。 终端 处 理会 在 第 13 章 中 说 明 。 





15 代码 


UNIX V6 源 代 码 对 应 现在 的 BSD 许可 证 ， 用 户 可 以 在 网 上 获取 代码 。 
本 书 附录 中 介绍 了 登载 UNIX V6 源 代 码 的 网 站 Ul, 


1.6 手册 


UNIX V6 向 用 户 提供 了 名 为 UNIX Programmers Manual (UPM) 的 手 
册 。 访 手册 包括 下 述 9 个 章节 ， 阅 读 内 核 代 码 时 需要 特别 注意 第 2 章 
和 第 4 章 。 如 采 硕 望 了 解 可 执行 程序 Caout) 的 格式 请 参考 第 5 章 。 本 
书 在 希望 读者 参考 UPM 的 某 个 章节 《比如 第 2 章 ) 时 ， 会 

以 *UPM(2) 的 形式 标注 。 如 果 在 阅读 代码 时 遇 到 难以 理解 的 内 容 ， 也 
请 参考 UPM. 








1. 手册 概要 
2. 一 般 命令 


3. 系统 调用 

4. C 语言 库 函 数 等 

5. 特殊 文件 6、 设 备 驱 动 

6 关于 特殊 文件 的 说 明 请 参照 7.1 节 。- 译 者 注 
6. 文件 格式 

7. 游戏 等 

8. 其 他 

9. 系统 管理 命令 和 守护 程序 


如 果 想 了 解 内 核 以 外 的 、 系 统 内 置 的 用 户 程 序 集 等 内 容 ， 请 参考 上 述 第 


1 章 、 第 3 章 、 第 5 章 、 第 8 章 。 


本 书 附录 中 介绍 了 登载 UNIX V6 手册 的 网 站 91, 








-> 
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UNIX V6 HE 3 EMILE I- HR SIJFA. T 1975 年 由 贝尔 实验 
EV x 


UNIX V6 BJ EA vb A MARERE ZR ERES] AE 
UNIX V6 的 内 核 提 供 了 系统 运行 所 必需 的 基本 功能 


内 核 回 用 户 隐 藏 了 对 人 硬件 的 操作 ， 以 及 保证 了 对 系统 具有 影响 的 处 
理 的 安全 性 和 可 维护 性 


用 户 程序 通过 系统 调用 问 内 核发 出 处 理 请 求 


PDP-11/40 及 周边 设备 的 寄存 器 被 映射 到 内 存 的 最 高 位 8KB 地 址 空 
[R] 

PDP-11/40 具有 r0~r7 的 8 个 通用 寄存 器 。 其 中 只 有 r6 又 分 为 两 
个 ， 分 别 对 应 内 核 模式 和 用 户 模 式 。 理 解 内 核 处 理 时 ，r5~r7 尤其 


重要 


"BH Xt 

内 核 将 执行 中 的 程序 作为 进程 加 以 管理 。 内 核 将 内 存 分 配给 进程 ,进程 
则 利用 被 分 配 到 的 内 存 进 行 处 理 。 第 IL 部 分 主要 对 下 述 内 容 进 行 说 明 。 
。 内 核 如 何 管理 进程 

。 内 存 如 何 分 配给 各 个 进程 

。 进程 如 何 访问 被 分 配 到 的 内 存 

。 如 何 并 行 执 行 多 个 进程 

。 如 何 有 效 利 用 内 存 空间 


阅读 这 部 分 内 容 之 后 ,想必 读者 对 程序 内 部 的 运行 机 制 会 有 更 深入 的 了 
解 。 








"cB 2x 进程 
2. 进程 的 概要 


什么 是 进程 


内 核 采 用 进程 的 概念 对 执行 中 的 程序 进行 管理 。 一 个 进程 对 应 一 个 执行 
中 的 程序 。 


在 执行 程序 时 ， 内 核 首先 将 程序 (以 文件 系统 中 的 文件 (参见 第 9 章 ) 
等 形式 保存 在 磁盘 上 ) 读 入 内 存 ， 然 后 将 此 内 存 区 域 分 配给 进程 。 进 程 
拥有 独立 的 虚拟 地 址 空间 ， 可 以 使 用 虚拟 地 址 空间 内 的 地 址 (虚拟 地 
HE) ， 由 MMU 转换 为 实际 的 内 存 地 址 《物理 地 址 ) ， 访 问 被 分 配 的 内 
存 。 在 使 用 物理 地 址 管理 内 存 时 ， 本 书 有 时 也 将 内 存 称 为 物理 内 存 。 


进程 具有 唯一 的 进程 ID 。 由 于 是 以 ID 为 识别 手段 ， 因 此 即使 同一 程序 
被 执行 多 次 生成 多 个 进程 ， 内 核 也 将 其 识别 为 不 同 的 进程 。 此 外 ， 由 于 
内 存 以 进程 为 单位 分 配 ， 而 且 进 程 的 虚拟 地 址 空间 各 上 自 独立 ， 因 此 各 个 
进程 在 执行 时 不 会 相互 影响 (图 2-1 ) 。 由 于 程序 的 指令 在 执行 时 不 会 
发 生变 化 ， 因 此 从 市 约 内 存 使 用 量 的 角度 出 友 ， 有 时 也 会 将 同一 块 内 存 
分 配给 多 个 进程 的 虚拟 地 址 空间 。 











物理 内 存 物理 地 址 进程 人 的 
虚拟 地 址 空间 
虚拟 地 址 


A 进程 B 的 
虚拟 地 址 空间 
Hd 虚拟 地 址 

0 


: 进程 C 的 

"s 虚拟 地 址 空间 

Mo 虚拟 地 址 
0 





图 2-1 相互 独立 的 虚拟 地 址 空间 
进程 的 并 行 执行 


UNIX V6 可 供 多 名 用 户 同 时 使 用 。 每 名 用 户 可 同时 执行 多 个 程序 ， 
此 在 任意 时 刻 ， 系 统 中 都 可 能 存在 多 个 进程 (图 2-2 ) 。 








系统 


图 2-2 系统 中 存在 多 个 进程 
但 是 ， 系 统 中 用 来 处 理 程 序 的 物理 CPU 只 有 一 个 ， 因 此 即使 存在 多 个 





进程 ， 真 正 处 于 执行 状态 的 进程 仍然 只 有 一 个 ， 其 他 的 进程 处 于 待机 状 
A (图 2-3)。 


用 户 
, | cmo 
Q CLER CER 
Ce o OO 
BU CHED 执行 中 的 进程 
> CER D 待机 中 的 进程 


图 2-3 可 执行 的 进程 只 有 1 个 

内 核 会 随时 切换 执行 中 的 进程 ， 将 时 间 片 分 给 不 同 的 进程 。 这 样 的 话 ， 
即使 只 有 1 个 物理 CPU, 也 可 以 并 行 处 理 多 个 程序 。 采 用 这 种 方式 的 系 
统 被 称 为 分 时 系统 (Time Sharing System, TSS) (图 2-4 . 


进程 1 进程 2 进程 3 时 间 


[| 


i 


B 执行 中 的 进程 


图 2-4 TSS 


尽管 在 任意 时 刻 都 只 存在 1 个 执行 中 的 进程 ， 但 是 通过 在 很 短 的 时 间 间 
隅 中 不 断 切 换 执 行 中 进程 的 方式 ， 使 用 户 产 生 多 个 程序 在 同时 运行 的 错 
党 。 在 以 后 的 说 明 中 ， 将 当前 执行 中 的 进程 称 为 执行 进程 。 


进程 的 执行 状态 
进程 的 执行 状态 可 以 分 为 两 种 : 可 执行 状态 和 休眠 状态 。 进 程 在 等 待 其 
他 资源 被 释放 或 等 待 周边 设 备 处 理 结束 时 ， 会 暂时 中 断 自身 的 处 理 ， xk 


0 he ER 
fT (图 2-5)。 


gap adm m 
-— 





77 0 或 1 个 T 
可 执行 状态 x 
ji 
| 
d / 执行 中 
/ / rr 
/ 待机 中 
! ”大 于 等 于 0 个 ”大 于 等 于 0 个 
1 T 
P qu 休眠 状态 


Sas, -i 


图 2-5 ”进程 的 执行 状态 
用 户 模式 和 内 核 模 式 


如 第 1 章 所 述 ， 处 理 器 具有 两 种 模式 : 用 户 模式 和 内 核 模 式 。 通 过 
PSW 能 够 在 两 者 间 进 行 切换 。 


切换 模式 时 ， 了 映射 到 虚拟 地 址 的 物理 内 存 区 域 也 随 之 发 生变 换 。 虚 拟 地 
址 在 用 户 模 式 时 映射 到 用 户 程序 的 内 存 区 域 ， 在 内 核 模式 时 则 映射 到 内 
核 程 序 的 内 存 区 域 (图 2-6 ) 。 内 存 映射 的 切换 由 MMU 来 实现 。 男 
oh 内 核 程序 在 系统 启动 时 被 读 取 到 内 存 中 ， 详细 说 明 请 参照 第 14 


章 。 





物理 内 存 内 核 程序 在 系统 启动 时 读 


取 到 内 存 中 。 访 问 内 核 程 
内 核 程序 序 前 必须 切换 到 内 核 模 式 










进程 A 的 
虚拟 地 址 空间 


进程 B 的 
虚拟 地 址 空间 





处 理 器 模式 的 切换 
伴随 着 虚拟 地 址 对 
应 的 物理 内 存 区 域 
的 切换 


图 2-6 用户 模式 和 内 核 模 式 


在 以 后 的 说 明 中 ， 将 用 户 模 式 时 的 虚拟 地 址 空间 称 为 用 户 空间 ， 内 核 模 
式 时 的 虚拟 地 址 空间 称 为 内 核 空间 。 此 外 ， 将 以 用 户 模 式 运行 的 进程 称 
为 用 户 进程 ， 以 内 核 模 式 运行 的 进程 称 为 内 核 进程 。 


因为 用 户 程序 由 用 户 进程 处 理 ， 所 以 无 法 访问 加 载 内 核 程序 的 内 存 区 

域 ， 也 就 无 法 执行 由 内 核实 现 的 功能 。 为 了 访问 内 核 功能 ， 用 户 程序 必 
须 通 过 系统 调用 向 内 核 提出 访问 内 核 功 能 的 请 求 。 系 统 调用 一 旦 被 执行 
后 ， 处 理 器 的 模式 将 切换 到 内 核 模式 ， 同 时 虚拟 地 址 空间 也 会 被 切换 到 
内 核 空 间 ， 内 核 功能 随 之 被 执行 。 内 核 处 理 结束 后 ， 处 理 费 的 模式 返回 
到 用 户 模式 ， 继 续 做 一 般 处 理 。 如 上 所 述 ，1 个 程序 进程) 的 处 理 伴 
随 着 在 用 户 模 式 和 内 核 模式 之 间 的 多 次 切换 (图 2-7 ) 。 





进程 的 处 理 示例 
用 户 模式 内 核 模式 


对 内 核发 出 处 理 请 求 
并 切换 至 内 核 模式 


内 核 处 理 





返回 用 户 模式 


图 2-7 进程 处 理 示 例 


内 核 提 供 的 功能 通 癌 会 对 系统 造成 很 大 影响 。 如 采 放 任用 户 程序 随意 使 
用 内 核 功 能 会 造成 各 种 各 样 的 问题 。 通 过 制定 规则 强制 用 户 程 序 使 用 内 
核 功 能 时 必须 提出 申请 ， 使 系统 的 安全 性 得 以 提高 。 同 时 也 使 用 户 程序 
开发 人 员 在 编写 程序 时 无 需 对 内 核 的 实现 细节 有 过 多 了 解 。 


在 系统 调用 等 处 理 中 ， 会 出 现 需要 在 用 户 空 间 和 内 核 空 间 之 间 交 换 数 据 
人 EE 
^J ER 

数 : fubyte(). fuibyte(). fuword(). fuiword(). subyte(). su 
suword(). suiword(). 











交换 处 理 


随 痢 进程 数量 的 增多 会 导致 内 存 容 量 不 足 。 内 核定 期 将 处 于 休眠 状态 、 
重要 度 较 低 的 进程 〈 所 需 的 数据 ) 会 从 内 存 转移 到 交换 空间 (swap 
out， 换 出 ) ， 或 者 将 交换 空间 中 已 处 于 可 执行 状态 的 进程 重新 恢复 到 
in; RA) 。 这 个 处 理 被 称 为 交换 处 理 ， 由 系统 局 动 时 生成 
和 进程 执行 。 





22 proc 结构 体 和 user 结构 体 


进程 的 状态 信息 和 控制 信息 等 由 proc 结构 体 和 user 结构 体 管 理 。 
个 进程 各 目 会 被 分 配 1 组 上 述 结构 体 的 实例 。proc 结构 体 常 驻 内 存 ， 
而 user 结构 体 有 可 能 被 移 至 交换 空间 。 


proc 结构 体 


由 proc 结构 体 构 成 的 数组 proc] 代码 清单 2-1 ) 中 的 每 个 元 素 分 别 
对 应 一 个 进程 。proc 结构 体 管 理 看 在 进程 状态 、 执 行 优先 级 等 与 进程 
相关 的 信息 中 需要 经 党 被 内 核 访 问 的 那 部 分 信息 〈 表 2-10 。 


举例 来 说 ， 内 核 在 进程 切换 过 程 中 )〉 选择 下 一 个 将 被 执行 的 进程 时 ， 

会 首先 检查 所 有 进程 的 状态 。 这 种 需要 遇 历 所 有 进程 的 情况 在 其 他 处 理 
中 也 会 经 党 出现。 由 于 proc[ ] 第 驻 内 存 ， 因 此 内 核 可 以 在 很 短 时 间 失 
完成 对 所 有 进程 状态 的 检查 。 假 如 proc[] 能 够 被 移 至 交换 空间 ， 内 核 
必须 访问 交换 空间 才能 取得 相应 数据 ， 这 会 导致 花费 过 多 时 间 并 引起 性 














proc[] 的 长 度 决定 了 在 系统 中 可 以 同时 存在 的 进程 上 限 。proc[] 的 长 
度 由 常量 NPROC 定义 ， 其 值 为 50〔 代 码 清单 2-2 ) 。 


代码 清单 2-1 proc 结构 体 (proc.h) 





1 struct proc 

2 { 

3 char p stat; 
4 char p flag; 
5 char p pri; 

6 char p sig; 

7 char p uid; 

8 char p time; 
9 char p. cpu; 

10 char p nice; 
11 int p ttyp; 
12 int p pid; 

13 int p ppid; 
14 int p addr; 


15 int p size; 


16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 





代码 清单 2-2 NPROC (param.h) 


int 
int 


p wc 


) proc[NPROC]; 


/* stat codes */ 


define 
define 
define 
define 
define 
define 


SSLEE 
SWAIT 
SRUN 
SIDL 
SZOMB 
SSTOP 


/* flag codes */ 


define 
define 
define 
define 
define 
define 


1 #define 


SLOAD 
SSYS 
SLOCK 
SSWAP 
STRC 
SWTED 


NPROC 


han; 
extp; 


P 


oui uNFK&mD| 


01 
02 
04 
010 
020 
040 


50 


表 2-1 proc 结构 体 


` ^ 


F NULL 时 意味 着 proc] 数组 中 该 元 素 为 








标志 变量 。 参 见 表 2-3 


执行 优先 级 。 数 值 越 小 优先 级 越 高 ， 下 次 被 执行 的 可 能 性 也 就 越 





接收 到 的 信号 





HÈ ID (整数 ) 





~ 
空 。 人 参见 





—— x 间 内 存在 的 时 间 ( 秒 》 
CPU 的 累计 时 间 (时 钟 tick 数 ) 


uice | 用 来 降低 执行 优先 级 的 补正 系数 。 缺 省 值 是 0， 通 过 系统 调用 nice 可 以 设 
P- 置 成 用 户 希望 的 数值 
























































父 进程 ID 
数据 段 的 物理 地 址 (单位 为 64 字 节 ) 1 
使 进程 进入 休眠 状态 的 原 


JI RB BE (text segment? 
























































1 进程 图 像 包 括 两 部 分 ， 一 部 分 是 常 驻 内 存 图 像 ， 如 proc[] ; 另 一 部 分 是 可 交换 图 像 
(swappable image) ， 如 PPDA、 数 据 区 域 、 栈 区 域 等 ， 这 一 部 分 可 以 被 交换 到 磁盘 上 。 
p_addr 是 指向 进程 的 可 交换 图 像 在 内 存 或 磁盘 上 的 地 址 。p_size 是 进程 可 交换 图 像 的 大 小 。 
审 校 者 注 


表 2-2 进程 的 状态 





















































SSLEEP 高 优先 级 休眠 状态 。 执 行 优 先 级 为 负 值 











低 优先 级 休眠 状态 。 执 行 优先 级 为 0 或 正 值 


等 得 被 跟踪 (trace) 























进程 图 像 处 于 内 存 中 (未 被 换 出 至 交换 空间 ) 


系统 进程 ， 不 会 被 换 出 至 交换 空间 。 在 UNIX V6 中 只 有 proc[e] 是 系统 进 
程 
进程 调度 锁 。 不 允许 进程 图 像 被 换 出 至 交换 空间 


SSWAP 进程 图 像 已 被 换 出 至 交换 空间 。 由 于 被 换 出 至 交换 空间 ，user.u_rsav[] 的 
值 不 再 有 效 。 必 须 从 user.u E 中 恢复 r5、r6 的 值 


— 
在 被 跟踪 时 使 用 






















































































user 结构 体 


user 结构 体 (代码 清 单 2-3、 表 2-4 ) 用 来 管理 进程 打开 的 文件 或 目录 
等 信息 。 由 于 内 核 只 需要 当前 执行 进程 的 user 结构 体 ， 因 此 当 进 程 被 
换 出 至 交换 空间 时 ， 对 应 的 user 结构 体 也 会 被 移出 内 存 。 


代码 清单 2-3 user 结构 体 Cuser.h) 





1 struct user 

2 { 

3 int u_rsav[2]; 

4 int u_fsav[25]; 

5 char u segflg; 

6 char u error; 

7 char u uid; 

8 char u gid; 

9 char u ruid; 
10 char u rgid; 
11 int u procp; 
12 char *u base; 
13 char *u count; 
14 char *u offset[2]; 
15 int *u cdir; 
16 char u dbuf[DIRSIZ]; 
17 char *u dirp; 
18 struct ( 

19 int u ino; 
20 char u name[DIRSIZ]; 
21 ) u dent; 
22 int *u pdir; 
23 int u uisa[16]; 
24 int u uisd[16]; 
25 int u ofile[NOFILE]; 
26 int u arg[5]; 
27 int u tsize; 
28 int u dsize; 
29 int u Ssize; 

30 int u Sep; 

31 int u qsav[2]; 

32 int u ssav[2]; 

33 int u signal[NSIG]; 
34 int u utime; 

35 int u stime; 

36 int u cutime[2]; 


37 int u cstime[2]; 


38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 





/* u error 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 
define 


*u are; 
u prof[4] 
u intflg; 


codes */ 
EFAULT 
EPERM 
ENOENT 
ESRCH 
EINTR 
EIO 
ENXIO 
E2BIG 
ENOEXEC 
EBADF 
ECHILD 
EAGAIN 
ENOMEM 
EACCES 
ENOTBLK 
EBUSY 
EEXIST 
EXDEV 
ENODEV 
ENOTDIR 
EISDIR 
EINVAL 
ENFILE 
EMFILE 
ENOTTY 
ETXTBSY 
EFBIG 
ENOSPC 
ESPIPE 
EROFS 
EMLINK 
EPIPE 


表 2-4 user 结构 体 





u rsav[] 























进程 切换 时 











3 


m 
© 
o 


\D 0 -0Uu1»u0un.DHnB 


30 


来 保存 r5 和 r6 的 当前 值 


u, segflg 


*u base 


*u count 


*u offset[] 


u dbuf[] 


*u dirp 


u dent 

















处 理 器 为 PDP-11/40 时 不 使 用 


读 写 文件 时 使 用 的 标志 变 和 



































出 错时 用 来 保存 错误 代码 。 参 见 表 2-5 


此 user 结构 体 对 应 的 数组 proc[] 的 元 素 





读 写 文件 时 用 于 传递 参数 




















读 写 文件 时 用 于 传递 参数 


读 写 文件 时 用 于 传递 参数 


当前 目录 对 应 的 数组 inode[] 的 元 素 















































供 函 数 namei 使 用 的 临时 工作 变量 ， 用 来 存放 文件 和 目录 名 


在 读 取 由 用 户 程序 或 内 核 程序 传 来 的 文件 的 路 径 名 时 使 有 
































供 函 数 namei() 使 用 的 临时 工作 变量 ， 用 来 存放 目录 数据 。u_ino 存 放 inode 
编号 ，u_name 存 放 文 件 和 目录 名 




















供 函 数 namei 存放 对 象 文 件 和 目录 的 父 目 录 





用 户 PAR 的 值 





用 户 PDR 的 值 





由 进程 打开 的 文件 








昌 户 程序 向 系统 调用 传递 参数 时 使 月 








ee [nnns m 
数据 区 域 的 长 度 〈 单 位 为 64 FH) 





栈 区 域 的 长 度 〈 单 位 为 64 字 节 ) 


u_sep 














里 器 为 PDP-11/40 时 此 项 基本 为 0 





















































在 系统 调用 处 理 里 信号 时 用 来 保存 r5 和 76 的 当前 值 


u_ssav[] 当 进 程 被 换 出 至 交换 空间 ， 导致 user.u rsav[] 的 值 不 再 有 效 时 ， 用 于 保 
存 r5 和 Fr6 的 当前 值 





日 于 设置 收 到 信号 后 的 动作 





own | 

















€ | 





昌 户 模式 下 占用 CPU 的 时 间 〈 时 钟 tick 数 ) 




















u stime 内 核 模式 下 占用 CPU 的 时 间 (时 钟 tick 数 ) 











u_cutime[] | 子 进 程 在 用 户 模式 下 占用 CPU 的 时 间 TEP tick 数 ) 


u cstime[] | 子 进 程 在 内 核 模式 下 占用 CPU 的 时 间 TEP tick 数 ) 


系统 调用 处 理 中 ， 操 作用 户 进 程 的 通用 寄存 器 或 PSW 时 使 用 





























hem [nre — 
志 变 量 ， 用 于 判断 系统 调用 处 理 中 是 否 发 生 了 对 信号 的 处 理 


“在 一 些 资料 中 ， 实 效用 户 、 实 效 组 、 实 际 用 户 、 实 际 组 也 被 称 为 有 效用 户 、 有 效 组 、 真 实用 
户 、 真 实 组 。 以 实效 用 户 和 实际 用 户 为 例 ， 登 录 系 统 时 实际 用 户 就 已 经 确定 ， 比 如 是 101。 寿 
用 这 个 用 户 运 行程 序 ， 则 实效 用 户 为 101 ， 知 用 su 命令 以 超级 用 户 身 份 运行 ， 则 实效 用 户 为 
0《〈 超 级 用 户 ) ， 而 实际 用 户 仍 为 101。 审 校 者 注 

























































































































































































表 2-5 错误 代码 ” 


3 此 列表 中 对 错误 代码 的 有 些 描述 并 不 全 面 ， 请 谨慎 参考 。 一 一 审 校 者 注 


错误 代码 
E 用 户 空 间 和 内 核 空间 之 间 传 送 数 据 失 败 等 


当前 用 户 不 是 超级 用 户 
指定 文件 不 存在 




































































言 号 的 目标 进程 不 存在 ， 或 者 已 结 



































ewm stim 
mo [o iti 





ENXIO 设备 编号 所 示 设 备 不 存在 








通过 系统 调用 exec 问 待 执行 程序 传送 了 超过 512 字 节 的 参数 


无 法 识别 待 执行 程序 的 格式 〈 魔 术 数字 ，magic number) 


EpADE ”| 试图 操作 未 打开 的 文件 ， 或 者 试图 写 入 用 只 读 模式 打开 的 文件 ， 或 者 斌 
图 读 出 用 只 写 模式 打开 的 文件 


执行 系统 调用 wait 时 ， 无 法 找到 子 进程 
执行 系统 调用 fork 时 ， 无 法 在 数组 proc[] PRIJETNE 
试图 向 进 超过 可 使 用 容量 以 上 的 内 存 
没有 对 文件 或 目录 的 访问 权限 















































不 是 代表 块 设备 的 特殊 文件 

执行 系统 调用 mount、umount 时 ， 作 为 对 象 的 挂 载 点 仍 在 使 用 中 
执行 系统 调用 link 时 该 文件 已 经 存在 
他 设备 上 的 文件 创建 连接 
试图 对 目录 进行 号 入 操作 















































EINVAL | 参数 有 误 


ENFILE 数组 file[] 溢出 
EMFILE 数组 user.u ofile[] 溢出 
ENOTTY | 不 是 代表 终端 的 特殊 文件 


准备 加 载 至 代码 段 的 程序 文件 曾 被 其 他 进程 当做 数据 文件 使 用 。 或 者 对 





























准备 加 载 至 代码 段 的 程序 文件 进行 了 写 入 操作 


文件 尺寸 过 大 

块 设备 的 容量 不 足 

对 管道 文件 执行 了 系统 调用 seek 
试图 更 新 只 读 块 设备 上 的 文件 或 目录 
文件 连接 数 过 多 
损坏 的 管道 文件 


内 核 可 以 通过 全 局 变量 u 访问 执行 进程 的 user 结构 体 ( 代 码 清单 2-4 
) ， 理 由 将 在 本 章 最 后 介绍 。 


代码 清单 2-4 u Cconf/m40.s) 
































1 .globl u 
u = 140000 


2.3 ”为 进程 分 配 的 内 存 


代码 段 和 数据 段 作 为 两 个 连续 的 物理 内 存 区 域 被 分 配给 进程 。 进 程 通过 
虚拟 地 址 访问 被 分 配 的 物理 内 存 区 域 。 


代码 段 

代码 段 是 只 读 的 ， 用 来 存放 作为 程序 指令 的 机 器 代码 。 某 个 程序 在 被 同 
时 执行 多 次 时 ， 各 进程 共享 同一 个 代码 段 。 代 码 段 通过 数组 text[] 3t 
行 管理 ， 长 度 由 user.u_tsize 表 示 。 

数据 段 

数据 段 用 来 存放 程序 使 用 的 变量 等 数据 。 数 据 段 与 代码 段 的 不 同 之 处 是 
de cl e 如 果 它 允许 被 共享 的 话 ， 某 个 进程 的 处 理 就 会 被 
别 的 进程 影响 。 


数据 段 的 物理 地 址 和 长 度 分 别 由 proc.p_addr 和 proc.p_size 表示 。 
数据 段 从 低位 地 址 开始 ， 依 次 由 下 述 3 个 部 分 组 成 (图 2-8 ) 。 


user 结构 体 | ~-~---- ". proc.p. addr 
内 核 栈 区 域 | 00 s-- USIZE 
j 数据 区 域 user.u_dsize 
proc.p_size 
栈 区 域 user.u ssize 
物理 内 存 


图 2-8 数据 段 
e PPDA (Per Process Data Area) 


o user 结构 体 和 内 核 栈 区 域 构成 


Oo 


长 度 为 USIZEx64 字 节 =1KB (代码 清单 2-5) 。 从 用 户 空 间 无 
法 访问 
代码 清单 2-5 USIZE (param.h) 


1 #define USIZE 16 


内 核 栈 区 域 被 用 作 内 核 处 理 时 的 临时 工作 区 域 。 每 个 进程 都 具 
有 供 内 核 模式 使 用 的 工作 区 域 


。 数据 区 域 


由 存放 全 局 变量 或 bss 等 静态 变量 的 区 域 和 进程 用 来 动态 管理 内 存 
的 堆 区 域 构成 。 扩 展 堆 区 域 需要 通过 系统 调用 来 完成 。 扩展 从 虚拟 
地 址 的 低位 同 高 位 方 同 进行 ， 长 度 由 user.u_dsize Xm. 

。 栈 区 域 


用 来 蜀 时 存放 函数 的 参数 或 局 部 数据 。 长 度 根据 需要 自动 扩展 。 栈 
区 域 的 扩展 从 虚拟 地 址 的 最 高 位 向 低位 方向 进行 ， 长 度 由 
user.u ssize 表示 。 

虚拟 地 址 空间 


进程 拥有 64KB 的 虚拟 地 址 空间 ， 通 过 长 度 为 16 比特 的 虚拟 地 址 访问 
物理 内 存 。 虚 拟 地 址 由 MMU 转换 成 长 度 为 18 比特 的 物理 地 址 ( 表 2-6 
j^ 


o 


























K 2-6 虚拟 地 址 空间 和 物理 地 址 空间 




















代码 段位 于 虚拟 地 址 空间 最 低位 的 地 址 ， 其 后 为 数据 区 域 ， 数 据 区 域 的 
M ic 8KB 为 边界 对 齐 。 栈 区 域 被 分 配 在 虚拟 地 址 空间 的 最 高 位 
地 址 (图 2-9)。 


虚拟 地 址 空间 


代码 段 | user.u tsize 


数据 区 域 user.u_dsize 


HM 数据 自 
P d 


Oxffff 栈 区 域 user.u ssize 


图 2-9 进程 的 虚拟 地 址 空间 


每 个 进程 都 拥有 独立 的 虚拟 地 址 空间 。 举 例 来 说 ， 茶 个 进程 的 虚拟 地 
HE A 和 其 他 进程 的 虚拟 地 址 A 所 指向 的 物理 地 址 是 不 同 的 。 但 是 ， 进 
程 间 共 至 代码 段 时 不 受 此 限制 (图 2-10 ) 。 








物理 地 址 
0 虚拟 地 址 


0 


虚拟 地 址 
0 






代码 段 
代码 段 ET. 


/ | 数据 区 域 


/ T 栈 区 域 
Oxffff 


^ 进程 B 的 
虚拟 地 址 空间 


u Ec 
PX To 





Oxffff 





进程 人 的 
虚拟 地 址 空间 


Ox3ffff 


物理 地 址 空间 


图 2-10 物理 地 址 空间 和 虚拟 地 址 空间 





在 虚拟 地 址 空间 中 ， 数 据 区 域 和 栈 区 域 可 被 视 作 不 同 的 段 。 此 外 ， 正 如 
将 在 第 3 草 中 介绍 的 那样 ， 内 核 为 了 使 数据 区 域 和 栈 区 域 成 为 不 同 的 段 
CR) ， 对 APR 进行 了 设 定 。 因 此 ， 在 虚拟 地 址 空间 中 ， 也 可 以 把 数 
据 区 域 和 栈 区 域 分 别称 为 数据 段 和 栈 段 。 本 书 为 了 和 物理 内 存 中 按照 连 
续 地 址 分 配 的 数据 段 (PPDA+ 数据 区 域 + 栈 区 域 ) 加 以 区 分 ， 在 以 后 
的 说 明 中 还 是 统一 将 其 称 为 数据 区 域 和 栈 区 域 。 


使 用 虚拟 地 址 具有 以 下 优点 。 
程序 能 够 使 用 以 任意 地 址 为 起 点 的 内 存 空间 


每 个 程序 都 可 以 将 以 任意 地 址 为 起 点 的 内 存 空 间作 为 目 己 使 用 的 内 存 区 
域 ， 无 需 考 虑 该 虚拟 地 址 与 物理 地 址 的 对 应 关系 。 


另外 ， 尽 管 在 发 生 交换 处 理 时 分 配给 进程 的 物理 地 址 会 发 生变 化 ， 但 是 
由 于 虚拟 地 址 始终 保持 不 变 ， 因 此 开发 人 员 在 编写 程序 时 无 需 考 碟 这 个 


问题 。 
实现 对 内 存 访 问 的 管理 


便于 实现 对 内 存 访问 的 管理 。 如 果 程 序 能 够 直接 访问 物理 地 址 ， 也 就 有 
可 能 访问 其 他 进程 正在 使 用 的 物理 内 存 区 域 。 而 使 用 虚拟 地 址 ， 通 过 将 
各 个 进程 的 虚拟 地 址 映射 到 不 同 的 物理 地 址 ， 就 可 以 保证 虚拟 地 址 空间 
的 独立 性 。 


此 外 ， 在 试图 访问 未 被 分 配给 目 己 的 内 存 区 域 ， 或 是 访问 不 具有 访问 权 
限 的 区 域 时 ， 可 以 通过 MMU 触发 异常 ， 中 止 进 程 的 处 理 。 


提高 内 存 的 使 用 效率 


在 需要 确保 一 定 长 度 的 连续 的 内 存 区 域 时 ， 通 过 将 不 连续 的 物理 内 存 区 
域 映 射 到 连续 的 虚拟 内 存 区 域 ， 可 以 提高 物理 内 存 的 使 用 效率 。 但 是 ， 
对 UNIX V6 而 言 ， 代 码 段 和 数据 段 本 号 与 连续 的 物理 内 存 区 域 相对 
人 
X y B ADT s 











变换 地 址 


MMU 通过 APR (Active Page Register) 寄存 器 将 虚拟 地 址 变换 为 物理 
地 址 (图 2-11 ) 。1 个 APR 由 1 个 PAR (Page Address Register) 寄存 
器 ( 表 2-7 ) 和 1 个 PDR (Page Description Register) 寄存 器 CX 2-8 

) 构成 。 









用 户 进程 的 APR 的 值 保 存在 
user £5 3 rp a 当 进 程 执行 时 ， 
会 将 保存 在 user 结构 体 中 的 
值 设 置 到 用 户 APR 中 








user 结构 体 








虚拟 地 址 


图 2-11 变换 地 址 


表 2-7 PAR 


B a m 


462-8 PDR 




















6 更 新 标志 。 表 示 页 是 否 被 更 新 

















值 为 1 时 页 按 高 位 地 址 向 低位 地 址 的 方向 进行 


页 的 访问 控制 方法 。00 : 未 分 配 、01 : 只 读 、11 : 读 写 





PDP-11/40 拥有 分 别 供 内 核 模 式 和 用 户 模式 使 用 的 两 套 APR. 


通过 切换 PSW 的 当前 模式 (PSW[15-14]) ， 可 以 在 硬件 上 切换 MMU 
参照 的 APR， 从 而 达到 切换 虚拟 地 址 空间 的 目的 〈 图 2-12 ) 。 


PSW 
15 14 13 0 


内 核 (00) RP (11) 





图 2-12 APR 的 切换 


内 核 通 过 问 与 执行 进程 相对 应 的 、 供 用 户 进程 使 用 的 APR 设 定 适 当 的 
值 ， 保 证 各 用 户 进程 拥有 独立 的 虚拟 地 址 空间 。 用 户 进 程 用 APR 的 值 
保存 在 user 结构 体 中 ， 当 该 进程 成 为 执行 进程 时 ， 会 将 保存 在 user 
结构 体 中 的 值 设置 到 用 户 进程 用 APR 中 。 


APR 共有 8 组 ， 编 号 为 0 到 7。 进 程 的 虚拟 地 址 空间 以 页 或 段 为 单位 


进行 管理 ，1 组 APR 对 应 1 X0. PAR 用 来 保存 与 各 页 物理 地 址 的 基地 
址 有 关 的 信息 ，PDR 用 来 保存 各 页 的 块 〈 以 64 字 节 为 单位 ) 数 以 及 是 
否 人 允许 访问 等 信息 。 每 一 页 最 多 可 以 被 分 配 128 个 块 (8KB) 。 


虚拟 地 址 的 高 位 3 比特 决定 了 对 应 的 页 CAPRO ，PAR 的 11~0 比特 决定 
了 作为 物理 地 址 基地 址 的 块 地 址 ， 加 上 虚拟 地 址 的 12~6 比特 得 到 物理 
内 存 的 块 地 址 ， 再 加 上 作为 块 内 偏 移 值 的 虚拟 地 址 的 5-0 比特 ， 就 得 到 
了 最 后 的 物理 地 址 (图 2-13 ) 。 





虚拟 地 址 
t- 39 172 G b 0 





PARIO] ~ [7] 


15 12 11 0 





物理 地 址 E 
17 6 5 0 
块 内 偏 移 值 


图 2-13 物理 地 址 的 计算 


内 核 之 所 以 可 以 通过 全 局 变量 uU (0140000 ) 访问 执行 进程 的 user 结 

构 体 ,是 因为 内 核对 供 内 核 模式 使 用 的 APR 做 了 相应 的 设 定 。 内 核 将 

内 核 模 式 使 用 的 编写 为 6 的 PAR 设 为 执行 进程 的 数据 段 的 物理 地 址 
(proc.p_addr) 〈 图 2-14 ) 。 


内 核 APR 物理 内 存 物理 地 址 0 


«—- proc.p addr 
LAE ol 专 行 进程 的 数据 有 自 








1_100_000_000_000_000 


图 2-14 通过 变量 访问 user 结构 体 

地 址 01400004 的 高 位 3 比特 为 6， 这 意味 着 内 核 模式 使 用 的 编号 为 6 的 
APR 将 被 选择 。 由 于 低位 的 比特 全 部 为 0， 因 此 u 指向 内 核 空间 第 6 页 
的 起 始 位 置 。 


4 注意 ， 此 处 为 八进制 地 址 。 一 一 译 者 注 








在 之 后 的 说 明 中 ， 统 一 将 内 核 模式 使 用 的 APR 称 为 “内 核 APR”, H 
户 模式 使 用 的 APR 称 为 “< 用户 APR”， 将 起 始 编号 从 0 开始 的 编号 为 n 
的 APR 标注 为 APRn。 此 外 ， 为 了 区 分 内 存 的 块 与 块 设备 的 块 (512 ^£ 
pun E 的 说 明 中 ， 会 将 内 存 的 块 标注 为 “以 64 字 节 为 单位 的 区 

或 "等 形式 。 


2.4 小结 

。 执 行 中 的 程序 以 进程 为 单位 进行 管理 

通过 不 断 切换 执行 中 的 进程 ， 达 到 并 行 执行 多 个 程序 的 效果 

proc 结构 体 和 user 结构 体 用 来 保存 进程 的 控制 和 状态 信息 

proc 结构 体 常 驻 内 存 ， 而 user 结构 体 有 可 能 成 为 内 存 交换 的 对 象 
进程 拥有 各 自 独立 的 虚拟 地 址 空间 

进程 被 分 配 了 代码 段 及 数据 段 的 两 个 连续 的 物理 内 存 区 域 

数据 段 由 PPDA、 数 据 区域 、 栈 区 域 3 部 分 组 成 

代码 段 被 映射 到 虚拟 地 址 空间 的 最 低位 地 址 

数据 区 域 被 映射 到 位 于 代码 段 之 后 的 虚拟 地 址 空间 ， 起 始 地 址 以 
OD DUDEN. EA, AERA E RR 


栈 区 域 被 映射 到 虚拟 地 址 空间 的 最 高 位 地 址 。 根 据 需 要 问 虚 拟 地 址 
的 低位 方 回 目 动 扩 展 
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3.1 进程 的 生命 周期 

进程 典型 的 生命 周期 如 下 所 示 (图 3-1 ) 。 


生成 子 进程 


Ee“ CFE 
切换 执行 进程 | 
wait | exec 


执行 另 一 个 程序 


exit 
取得 子 进 进入 僵尸 状态 
程 的 执行 
结果 并 清 
理子 进程 


图 3-1 进程 的 生命 周期 

1. 茶 个 进程 通过 系统 调用 fork， 创 建 一 个 用 于 执行 程序 的 进程 。 生 成 
此 进程 的 进程 称 为 父 进程 ,被 生成 的 进程 称 为 子 进 程 。 子 进程 通过 复制 
父 进程 的 数据 得 以 创建 。 

2. 父 进程 执行 系统 调用 wait， 进 入 等 待 状态 直到 子 进程 处 理 结 来 。 


3. 当 控 制 权 转移 到 子 进程 后 ， 子 进程 通过 系统 调用 exec 将 程序 读 取 到 
内 存 并 开始 执行 。 


4. 当 程 序 执行 完毕 后 ， 子 进程 通过 系统 调用 exit 结束 自身 的 运行 并 进入 














僵尸 状态 ， 控 制 权 交 回 父 进程 。 

5. 父 进程 得 到 子 进程 的 执行 结果 后 清理 子 进程 。 

代码 清单 3-1 是 用 C 语言 编写 的 进行 上 述 处 理 的 例子 。C 语言 的 函数 库 
a 的 函数 ， 使 用 户 程序 可 以 像 执行 普通 函数 那样 
访问 系统 调用 。 


代码 清单 3-1 进程 的 生命 周期 


i s fork(); F | 4 
if (i == 0) { * 








E execv(program name, argv); ` 
4 exit(); 

E NUM lli. 56 Y 
1 执行 fork() 将 生成 一 个 进程 。 父 进程 通过 fork() 得 到 子 进 程 
的 ID CE 0 的 整数 ) 。 

6 执行 wait() 后 进入 等 待 状态 直至 子 进程 处 理 结束 。 父 进程 进 
入 休眠 状态 ，《“ 如 条 此 时 不 存在 其 他 执行 优先 级 更 高 的 进程 ) 控制 
权 将 被 转交 给 子 进程 。 

1 子 进程 从 fork() 内 部 开始 进行 目 身 的 处 理 ， 并 从 fork() 返回 
0。 

3 ”在 程序 最 后 ， 执 行 由 编译 圳 插 入 的 用 以 访问 系统 调用 exit 的 指 
令 以 终止 进程 。 


4 此 处 加 入 exit() 是 为 了 防止 execv() 执行 失败 。 


6 控制 权 被 交 回 父 进程 。 通 过 wait() 返回 已 结束 的 子 进程 的 
ID. 





3.2 创建 进程 


进程 的 复制 

通过 将 父 进程 的 数据 复制 到 子 进程 ,以 此 创建 新 的 进程 。 由 于 可 以 将 此 
过 程 看 做 对 进程 的 分 支 处 理 ， 因 此 创建 进程 的 系统 调用 被 命名 为 
fork. 


MC ER uH Pr (图 3-2 ) 。 





创建 进程 的 进程 成 为 
被 创建 进程 的 父 进程 
procl 指向 数组 text] 的 同一 元 素 _ texti 


proc.p. ppid(* 





数据 段 


t bl 
LM 


代码 段 


已 打开 的 文件 和 当前 目 
录 等 数据 也 被 继承 


图 3-2 进程 的 生成 
。 复制 proc[] 数组 元 素 
o 子 进程 的 proc.p_ppid 指向 父 进程 的 proc.p_pid。 
。 复制 数据 段 


o 复制 对 象 包括 PPDA。 子 进程 继承 了 已 打开 的 文件 和 当前 目录 
等 数据 。 








o 子 进 程 的 user.p procp 指向 proc[] 中 代表 子 进程 的 元 素 。 


。 代 码 段 不 是 复制 对 象 。 子 进程 与 父 进程 共享 text[] 中 的 相同 
元 素 。text[] 用 来 管理 代码 段 ， 详 细 请 参考 第 4 章 。 








父 进 程 和 子 进程 


创建 进程 的 进程 称 为 父 进 程 ,被 其 创建 的 进程 称 为 子 进程 。 将 子 进程 的 
proc.p ppid 设置 为 父 进程 的 ID。 反 之 ， 父 进程 若 想 确定 自己 的 子 进 
程 ， 必 须 遍 历 proc [ ] 找到 所 有 proc.p_ppid 指向 自己 的 进程 (图 3-3 
) 





父 
1 个 父 进程 ( proc[0] 除外 ) 对 应 
0 个 以 上 ( 包括 0 个 ) 子 进程 
proc.p. ppid proc.p. ppid 
子 进 程 的 proc.p_ppid 指向 父 进程 
proc.p. ppid proc.p. ppid 
roc.p. ppid 
若 想 确定 自己 的 子 进程 ， 必须 遍 
历 proc[] 找到 所 有 proc.p. ppid 指 
二 向 自己 的 进程 


图 3-3 父 进 程 和 子 进程 
父 进程 和 子 进程 具有 如 下 特点。 

。 各 进程 拥有 1 个 父 进程 和 0 个 以 上 (包括 0 个 ) 的 子 进程 
父 进 程 在 子 进程 结束 时 ， 取 其 结束 状态 并 释放 子 进程 资源 
子 进程 继承 了 父 进程 打开 的 文件 和 当前 目录 等 数据 


子 进程 和 父 进程 共享 代码 段 。 但 是 ， 如 果子 进程 执行 了 其 他 程序 ， 
这 种 共 至 关系 将 被 解除 


由 于 子 进程 和 父 进程 各 目 独 立 ， 因 此 他 们 拥有 独立 的 数据 段 ，user 
结构 体 和 proc[] 数组 元 系 。 在 执行 时 不 会 相互 影响 














UNIX V6 提供 了 使 父 进程 可 以 介入 子 进 程 处 理 的 跟踪 机 制 ， 以 及 用 于 
实现 父 了 进程 问 通 信 的 萤 者 机 制 。 在 第 6 章 和 第 11 章 将 分 别 对 它们 进 
行 介绍 。 


系统 调用 fork 


创建 新 进程 时 需要 使 用 系统 调用 fork。 系 统 调用 的 详细 介绍 请 参考 第 5 
章 ， 现 在 只 需要 了 解 通过 内 核 进程 处 理 系统 调用 即 可 。 

用 C 语言 编写 的 用 户 程序 在 执行 fork() 时 会 首先 调用 C 语言 的 库 函 数 
fork()， 在 此 库 函 数 中 再 通过 执行 sys fork 来 访问 系统 调用 fork CX 
码 清 单 3-2 ) 。 


代码 清单 3-2. CE HERI PE PR. fork() (source/s4/fork.s) 














1 .globl .fork, cerror, par uid 
2 
3 for: 
4 mov r5,-(sp) 
人 
5 mov sp,r5 
6 sys fork | ^ 
7 br 1f `i i 
1 "t 
8 bec 2f I ` 
= D * 
9 jmp cerror 2 Y 
1 
TO T I 
1 
Ir mov rO, par uid 2 
12 clr ro P 
13:2 
14 mov (sp)+,r5 
15 rts pc 
l6 .bss 
i7 par uid: s meE2 


3 UNIX V6 的 C 编译 器 将 C 语言 的 函数 转换 为 起 始 位 置 带 有 下 划 
Ax" “的 标签 。 因此 ， 这 里 的 _fork: 就 相当 于 C 语言 的 fork() FÉ 


sys 指令 是 用 来 执行 系统 调用 的 汇编 指令 ， 它 的 参数 是 代表 执行 哪个 系 
统 调用 的 整数 。 此 时 ， 控 制 权 由 用 户 进 程 交 给 内 核 进 程 ， 内 核 的 
fork() 被 执行 ， 使 得 创建 进程 的 处 理 也 开始 执行 (代码 清单 3-3 ) 。 


系统 调用 fork 针对 父 进程 和 子 进程 各 返回 1 次 !。 父 进程 和 子 进程 的 
处 理 如 下 所 示 。 



































1 父 进 程 和 子 进程 此 时 共用 一 份 代码 ， 父 进程 从 fork 返回 处 继续 运行 ， 而 子 进程 从 fork 返回 
处 开始 运行 。 一 一 译 者 注 





























代码 清单 3-3 fork() (sys/ken.c) 


ork() 


一 ch 


register struct proc *p1, *p2; 


p1 = u.u procp; 
for(p2 = &proc[0]; p2 « &proc[NPROC]; p2++) 
if(p2-»p stat -- NULL) 
goto found; 
u.u error = EAGAIN; 
goto out; 


oo NOU i» un.€nmnÓ| 


found: 
if(newproc()) { 

.u are[Re] = pi-»p pid; 
.u cstime[0] 0; 

.u cstime[1] 0; 

.u stime = 6; 

.u cutime[0] 0; 

.u cutime[1] 0; 

.u utime - 6; 


} 
p2->p_pid; 


+ 2; 





父 进 程 的 处 理 
5 将 pl 指向 执行 进程 ( 父 进程 ) 的 proc 结构 体 。 


610 MEMEH proc] 寻找 未 使 用 的 元 素 ， 技 到 后 将 p2 
指 癌 该 元 素 ， 然 后 跳 转 至 found (图 3-4) 。 





p stat: NULL 





图 3-4 寻找 未 使 用 的 roc[] 数组 元 素 


13 找到 未 使 用 的 元 素 后 ， 调 用 newproc() 生成 新 的 进程 。 由 于 
oe 向 父 进程 返回 0， 因 此 此 处 if 条 件 的 值 在 父 进程 上 为 
段 。 
23 ”将 父 进程 的 r0 设 为 子 进程 的 proc.p_pid ,以 此 作为 系统 调 
用 fork 对 父 进 程 的 返回 值 。 通 过 u.u are 可 以 访问 用 户 进程 的 
寄存 器 。 详 细 说 明 请 参考 第 5 章 。 
26 ”将 父 进 程 的 程序 计数 器 指 癌 下 一 条 指令 。 
内 核 的 fork() 处 理 到 此 结束 ， 下 面 来 看 一 下 返回 到 C 语言 库 函 数 
fork() 后 的 处 理 〈 代 码 清单 3-2 ) 。 


用 户 进 程 的 程序 计数 喜 已 经 被 修改 ， 此 时 指 回 前 面 给 出 的 汇编 代码 
fork.s 的 第 8 fT. 

bec 指令 用 来 检查 进 / 借 位 标志 (PSW[0]) 是 否 为 0。 在 系统 调用 处 理 
中 如 果 出 现 错误 ， 此 标志 将 被 置 1。 如 果 此 标志 为 0 则 跳 转 到 第 13 

行 ， 通 过 rts 指令 返回 调用 C 语言 库 函 数 fork() 的 位 置 。 返 回 值 为 
保存 在 r0 中 的 子 进程 的 ID。 


子 进程 的 处 理 


在 内 核 的 fork() 处 理 中 ， 子 进程 从 newproc() 返回 处 开始 执行 〈 代 
码 清单 3-3 ) 。 

















13 newproc() 对 子 进程 返回 1， 因 此 if 条 件 的 值 在 子 进程 上 为 
zt T 返回 处 开始 执行 和 返回 值 为 1 的 原因 将 在 
吾 文 中 说 明 。 


14421 将 用 户 进程 的 r0 设 定 为 父 进 程 的 proc.p_pid, 以 此 作为 
系统 调用 fork 对 子 进程 的 返回 值 。 在 处 理 结束 前 ， 进 程 的 执行 时 
间 被 清 0。 


内 核 的 fork() 处 理 到 此 结束 ， 下 面 来 看 一 下 返回 到 C 语言 库 函 数 
fork() 后 的 处 理 〈 代 码 清单 3-2 ) 。 


在 前 面 给 出 的 汇编 代码 fork.s E, sys fork 处 理 结 束 后 将 继续 执行 

第 7 行 的 br 1f。br 是 无 条 件 分 文 〈 转 移 ) 指令 ，1f 表示 跳 转 到 下 一 

条 标签 所 在 的 位 置 。 第 11 行 的 mov 指令 将 父 进程 的 proc.p pid 复制 
到 _par_uid 中 ， 然 后 将 r0 清 0。 调 用 C 语言 库 函 数 fork() 的 用 户 程 
序 可 以 通过 _par_uid 取得 父 进程 的 ID。 第 15 行 的 rts 指令 用 来 返回 
调用 C 语言 库 函 数 fork() 的 位 置 ， 返 回 值 为 保存 在 ro 中 的 0。 


newproc() 


newproc() 是 实际 创建 进程 的 函数 (代码 清单 3-4 ) 。 它 负责 将 
proc[] 中 代表 执行 进程 的 元 素 和 执行 进程 的 数据 段 复制 到 子 进程 中 。 
代码 段 不 属于 复制 对 象 ， 子 进程 和 执行 进程 共享 相同 的 代码 段 。 


代码 清单 3-4 newproc() (ken/slp.c) 











n 
{ 


ewproc() 


int a1, a2; 

struct proc *p, *up; 
register struct proc *rpp; 
register *rip, n; 


p = NULL; 


retry: 


/* 生成 ID */ 

mpid++; 

if(mpid < 0) { 
mpid = 6; 
goto retry; 




















} 
/* 在 proc[] 中 寻找 未 使 用 的 元 素 */ 
for(rpp = &proc[0]; rpp < &proc[NPROC]; rpp++) 1 
if(rpp-»p stat == NULL && p--NULL) 
p = rpp; 
if (rpp->p_pid==mpid) 
goto retry; 


} 
if ((rpp = p)==NULL) 
panic("no procs"); 


/* 生成 proc[] 元 素 */ 

rip = u.u procp; 

up = rip; 

rpp-»p stat SRUN; 

rpp-»p flag - SLOAD; 

rpp-»p uid = rip-»p uid; 
rpp-»p ttyp - rip-»p ttyp; 
rpp-»p nice rip-»p nice; 
rpp-»p textp = rip-»p textp; 
rpp-»p pid = mpid; 


36 rpp-»p ppid = rip-»p pid; 

37 rpp-»p time - 6; 

38 

39 /* 将 参照 计数 器 加 1 */ 

40 for(rip = &u.u ofile[0]; rip « &u.u ofile[NOFILE];) 
41 if((rpp = *rip++) !- NULL) 
42 rpp-»f count--*; 

43 if((rppszup-»p textp) != NULL) ( 
44 rpp-»x count; 

45 rpp-»x ccount--; 

46 } 

47 u.u cdir-»i count++; 

48 

49 /* 复制 数据 段 */ 

50 savu(u.u rsav); 

51 rpp = p; 

52 u.u_procp = rpp; 

53 rip = up; 

54 n = rip->p_size; 

55 al = rip-»p addr; 

56 rpp-»p size- n; 

57 a2 - malloc(coremap, n); 

58 if(a2 -- NULL) { 

59 rip-»p stat - SIDL; 

60 rpp-»p addr = a1; 

61 savu(u.u ssav); 

62 xswap(rpp, 0, 0); 

63 rpp-»p flag -| SSWAP; 

64 rip-»p stat - SRUN; 

65 ) else ( 

66 rpp-»p addr = a2; 

67 while(n--) 

68 copyseg(al++, a2++); 
69 } 

70 u.u procp - rip; 

71 return(0); 

72 ) 





11715 mpid 是 用 来 向 进程 分 配 ID 的 全 局 变量 (代码 清单 3-5) 。 


代码 清单 3-5 mpid (system.h) 


1 int mpid; 


每 次 创建 一 个 新 的 进程 ，mpid 就 会 随 之 加 1。 这 个 mpid 是 分 配给 子 进 
程 的 ID。 


mpid 是 int 型 的 变量 ， 随 着 值 的 不 断 增加 ， 最 高 位 的 符号 位 最 终 会 被 
置 1， 导 致 出 现 负 数 。 这 时 mpid 会 重 置 为 0 并 再 次 尝试 加 1。 当 时 的 C 
语言 还 不 存在 unsigned 型 的 定义 。 


17-24 ”从 起 始 位 置 遍 历 procL] 寻找 未 使 用 的 元 素 。 如 果 不 存 在 
这 样 的 元 素 说 明 proc[] 的 空间 已 被 用 尽 ， 此 时 调用 panic() 停止 


系统 运行 。 


与 此 同时 ， 检 查 proc[] 的 各 个 元 素 的 成 员 变 量 proc.p pid, ff 
认 是 否 存在 某 个 进程 ， 其 ID 与 即将 分 配 的 ID 相同。 如果 存 在 这 样 
的 进程 则 再 次 生成 ID。 


27-28 ”开始 对 子 进 程 进 行 初始 设 定 。 从 u.u procp 取得 proc[] 
中 代表 执行 进程 〈 父 进程 ) 的 元 素 。 


29~37 rpp 中 存放 了 proc[] 中 未 被 使 用 的 元 素 。 此 处 对 rpp Xt 
行 下 述 设 定 。 





e 可 执行 状态 CK proc.p stat 设 定 为 SRUND 
e 位 于 内 存 中 (设置 SLOAD 标志 位 ) 

。 分 配 ID (将 proc.p_pid 设 定 为 mpid) 

o 执行 时 间 为 0 (将 proc.p_time 设 定 为 0) 


。 父 进程 为 执行 进程 (将 proc.p_ppid 设 定 为 执行 进程 的 
proc.p_pid) 


此 外 ，proc.p_uid、proc.p_ttyp、proc.p_nice 和 
proc.p_textp 继承 了 父 进 程 相 应 的 数据 。 


40-42 ”由 于 子 进 程 继承 了 由 父 进程 打开 的 文件 ， 因 此 这 些 文件 的 
A UTC RED 1。 关 于 已 打开 文件 的 参照 计数 器 ， 请 参见 第 10 
草 。 








43-46 ”因为 子 进程 与 父 进程 指向 text[ ] 中 相同 的 元 素 ， 所 以 此 
元 素 的 参照 计数 器 加 上 1。 关 于 text.x count 和 
text.x ccount 的 不 同 详 见 第 4 章 。 


47 ”由 于 子 进程 继承 了 当前 目录 的 数据 ， 因 此 inode[ ] 中 对 应 此 
目录 的 元 素 的 参照 计数 器 加 上 1。 关 于 inode[] 数组 元 素 的 说 明 请 
参见 第 9 章 。 


50 调用 savu()， 将 r5、Fr6 的 当前 值 暂 存 至 


user.u rsav. savu() 会 在 下 一 节 中 介绍 。 


51-53 和 暂时 将 父 进程 的 user.u_procp 指向 proc[] 中 代表 子 进 
程 的 元 素 。 此 时 复制 出 来 的 父 进程 数据 段 ， 其 user.u procp 将 指 
向 proc[ ] 中 代表 子 进程 的 元 素 ， 这 样 等 于 为 子 进程 构造 了 一 份 与 
父 进程 完全 相同 但 却 属于 子 进程 自身 的 数据 段 。 至 于 父 进程 本 身 ， 
我 们 在 rip 中 暂 存 了 proc[] 中 代表 父 进程 的 元 素 ， 用 于 在 第 70 
行 恢复 它 的 user.u_procp。 


54-56 ”将 子 进 程 数据 段 的 长 度 设置 为 父 进 程 数 据 段 的 长 度 。al 中 
保存 了 父 进程 数据 段 的 物理 地 址 。 


57 调用 malloc() 尝试 分 配 的 一 块 与 父 进程 的 数据 段 相同 长 度 的 
内 存 。malloc( ) 是 用 来 分 配 内 存 或 交换 空间 的 函数 ， 如 果 执 行 成 
功 则 返回 被 分 配 区 域 的 物理 地 址 ， 如 果 失 败 则 返 回 NULL。 本 章 的 
最 后 将 具体 说 明 此 函数 。 


根据 malloc() 执行 的 成 功 与 个 ， 接 下 来 的 处 理会 有 所 不 同 。 如 果 
内 存 分 配 成功 ， 数 据 段 将 被 复制 到 此 区 域 。 如 有 果 内 存 没有 足够 的 空 
间 ， 父 进程 的 数据 段 会 被 复制 到 交换 空间 (作为 子 进程 的 数据 
段 ) ， 竺 数据 从 交换 空间 换 入 内 存 时 再 对 其 分 配 内 存 〈 图 3-5) 。 























malloc() 执 行 失败 


父 进程 的 | 


proc.p. addr 通过 xswap() 
复制 
父 进程 的 数据 段 子 进程 的 数据 段 


malloc() 执 行 成 功 


通过 malloc() 取 得 ——9 
的 区 域 的 地 址 
子 进程 的 数据 段 


图 3-5 数据 段 的 复制 
58 ”以 下 是 malloc) 执行 失败 时 的 处 理 。 


59 ”将 父 进程 的 状态 设置 为 SIDL。 处 于 SIDL 状态 的 进程 不 会 被 先 
中 成 为 执行 进程 ， 也 不 会 被 换 出 至 交换 空间 。 执 行 第 62 行 的 
xswap() 时 ， 复 制 父 进程 的 数据 段 到 交换 空间 的 处 理 被 启动 。 在 此 
处 理 过 程 中 ， 父 进程 将 暂时 进入 休眠 状态 。 将 其 设置 成 SIDL 状态 
是 为 了 防止 在 复制 处 理 中 父 进程 成 为 执行 进程 ， 或 其 内 存 数据 被 换 
出 导致 数据 发 生变 化 。 


60 ”将 子 进程 的 数据 段 地 址 设 为 与 父 进程 的 数据 段 地 址 相同 。 


61 执行 savu(u.u_ssav), 将 r5、r6 的 当前 值 暂 存 至 
u.u_ssav。 因 为 数据 段 包 含 user 结构 体 ， 所 以 u.u_ssav 也 将 被 
复制 到 子 进程 。 


62 执行 xswap() 将 数据 从 内 存 换 到 交换 区 。 由 于 将 rpp 的 
p addr 设置 为 父 进程 的 数据 段 地 址 ， 因 此 父 进程 的 数据 段 成 为 处 
理 对 象 。 由 于 xswap() 的 第 二 个 参数 为 0， 因 此 内 存 中 的 数据 段 不 


= 





保留 内 存 中 数据 的 同时 ， 向 
交换 空间 换 出 数据 ( 由 内 存 
向 交换 空间 复制 ) 











会 被 释放 ， 数 据 段 将 从 内 存 复 制 到 交换 空间 中 去 。 
63 ”将 子 进程 的 SSWAP 标志 位 置 1。 


a 内 存 癌 交换 空间 的 复制 处 理 结 束 后 ， 将 父 进程 恢复 为 SRUN 


65 以 下 是 malloc() 执行 成 功 时 的 处 理 。 


66-68 ”将 子 进程 的 数据 段 地 址 设置 为 通过 malloc() 取得 的 内 存 
区 域 的 物理 地 址 。 然 后 从 父 进程 辣子 进程 复制 数据 段 。 


70~71 ”将 父 进程 的 user.u_procp 恢复 原状 后 返回 0。 在 前 面 对 
ud 的 说 明 中 也 提 到 过 这 一 点 , 即 newproc() 对 父 进程 的 返回 
值 为 0。 





panic() 


panic() 通过 对 idle() 进行 循环 调用 以 阻止 程序 继续 执行 《 表 3-1. 
代码 清单 3-6 ) 。 此 函数 将 在 由 于 资源 项 乏 等 原因 导致 内 核 处 理 无 法 继 
续 进 行 的 情况 下 被 执行 。idle() 内 部 将 处 理 器 优先 级 设置 为 0， 然后 
执行 汇编 指令 wait 进入 等 得 中断 的 状态 代码 清单 3-7 ) 。 









































“此 处 将 处 理 器 优先 级 置 0， 使 得 当前 进程 可 以 响应 所 有 优先 级 的 中 断 。 关 于 中 断 优先 级 请 参 
第 5 章 。 审 校 者 注 























代码 清单 3-6 panic() (ken/prf.c) 


1 panic(s) 
2 char *s; 


3 { 

4 panicstr = s; 

5 update(); 

6 printf("panic: %s\n", s); 
7 for(;;) 

8 idle(); 

9} 





代码 清单 3-7 idle() (m40.s) 


1 .globl _idle 

2 _idle: 

3 mov PS, -(sp) 
bic $340,PS 


wait 
mov (sp)+,PS 
rts pc 





3.3 ”切换 执行 进程 
中 断 执行 进程 


执行 进程 在 执行 内 核 函数 sleep( ) 后 进入 休眠 状态 并 中 断 当 前 处 理 。 
此 后 ,由 于 swtch() 被 调用 ,执行 进程 友 生 切 换 (图 3-6 ) 。 


进程 1 进程 2 时 间 ] 


mm 执行 中 的 进程 


图 3-6 sleep() 和 swtch() 

内 核 函数 sleep) 一 般 在 下 述 情况 下 被 调用 。 
用 户 程序 访问 了 系统 调用 wait 

等 待 周边 设备 处 理 完 毕 

等 待 使 用 中 的 资源 被 释放 


只 有 处 于 可 执行 状态 的 进程 才 有 机 会 成 为 执行 进程 。 处 于 休眠 状态 的 进 
程 除 非 该 状态 被 解除 ， 人 否则 无 法 再 次 被 执行 。 


进程 的 执行 状态 


进程 的 状态 由 proc.p_stat 表示 。SRUN 表示 可 执行 状态 ，SSLEEP 和 








SWAIT 表示 休眠 状态 。 


sleep() 将 执行 中 的 进程 设置 为 SSLEEP 或 SWAIT 状态 。wakeup() 将 
对 象 进程 设置 为 SRUN 状态 C 3-2、 图 3-7 ) 。 在 之 后 的 说 明 中 会 将 进 
入 休眠 状态 的 过 程 用 “入 睡 ” 来 表示 ， 将 从 休 虐 状态 恢复 至 执行 状态 的 过 
程 用 “被 唤醒 ”来 表示 。 


表 3-2 进程 的 执行 状态 


SRUN 可 执行 状态 


休眠 状态 。SSLEEP 和 SWAIT 的 区 别 在 于 被 唤醒 后 的 执 
行 优先 级 





sleep() 





可 执行 状态 休眠 状态 


sleep() 
一 一 


征 — ———————— 
wakeup/) 
图 3-7 ”状态 迁移 图 
选择 执行 进程 的 算法 


swtch() 用 来 选择 下 一 个 将 被 执行 的 进程 。 它 从 起 始 位 置 授 历 
proc[]， 并 将 满足 下 列 条 件 ”的 进程 选择 为 执行 进程 。 














3 此 处 漏 了 一 个 条 件 ， 进 程 图 像 在 内 存 中 。 对 于 进程 图 像 不 在 内 存 中 的 进程 ， 不 能 被 swt ch() 
选择 为 执行 进程 ， 而 是 经 由 0# 进程 sched() 调度 进程 图 像 到 内 存 后 才能 被 swtch() 选择 。 
请 参看 第 4 章 。 一 一 审 校 者 注 
































e 处 于 可 执行 状态 (SRUN) 
e 拥有 最 高 的 执行 优先 级 (proc.p_pri 的 值 最 小 ) 


将 某 个 进程 明确 指定 为 执行 进程 是 无 法 做 到 的 。 比 如 ， 在 辣子 进程 转移 
控制 权 的 时 候 经 常会 利用 系统 调用 wait， 但 是 如 果 此 时 存在 执行 优先 
级 更 高 的 进程 ， 访 进程 将 被 优先 执行 。 
setpri() 函数 用 来 随时 调整 各 进程 的 执行 优先 级 。 占 用 CPU 时 间 越 长 
的 进程 ， 其 执行 优先 级 将 会 逐渐 降低 。 由 于 执行 优先 级 决定 了 被 选择 的 
进程 ， 因 此 ， 可 以 说 setpri() 中 执行 优先 级 的 计算 方法 对 执行 进程 
的 选择 具有 决定 性 意义 。 
setpri() 在 下 述 处 理 中 将 被 执行 。 

e 时 钟 处 理 ( 参 见 第 5 F) 

e 信号 处 理 〈 参 见 第 6 F) 
上 下 文 切换 
执行 进程 被 中 断 时 ， 将 当前 执行 状态 保存 于 user 结构 体 中 。 当 被 中 断 
的 进程 再 次 执行 时 ， 通 过 user 结构 体 恢复 以 前 的 执行 状态 。 这 个 处 理 
被 称 作 上 下 文 切换 。 
上 下 文 切 换 处 理 主 要 通过 以 下 由 汇编 语言 编写 的 函数 来 完成 ， 即 
savu(). retu(). aretu(). F] user 结构 体 保存 数据 的 处 理由 
savu() 完成 ， 从 user 结构 体 恢复 数据 的 处 理由 retu() 和 aretu() 
完成 。 














系统 调用 wait 


用 户 程序 执行 系统 调用 wait 后 ， 该 进程 的 执行 将 被 中 断 ， 控 制 权 转交 
给 其 他 进程 。 


wait 具有 以 下 两 个 功能 。 中 断 当前 进程 等 待 子 进 程 执 行 结束 ， 以 及 清 
理 执 行 结束 的 子 进 程 。 在 3.5 节 中 详细 介绍 wait. 
sleep() 


sleep() 首先 将 执行 中 的 进程 设置 为 休眠 状态 CSSLEEP. SWAIT) CK 
3-4、 代 码 清单 3-8 ) ， 然 后 调用 swtch() 切换 执行 进程 。 


sleep() 接受 两 个 参数 : chan 和 pri. chan 为 任意 变量 的 地 址 ， 其 值 
将 被 赋 给 执行 进程 的 proc.p_wchan。wchan 代表 waiting channel， 表 
示 此 进程 正在 等 待 proc.p_wchan 所 指向 的 资源 。 


wakeup ( ) 将 进程 从 休眠 状态 唤醒 至 可 执行 状态 。 与 sleep() 相同 ， 它 
也 接受 任意 变量 地 址 为 参数 ， 然 后 依次 检查 各 进程 的 proc.p_wchan， 
并 将 参数 一 致 的 进程 设置 为 可 执行 状态 〈SRUN) 。 系 统 利用 sleep() 
和 wakeup() 实现 多 个 进程 等 待 同 一 资源 时 的 同步 处 理 (图 3-8 ) 。 


进程 1 进程 2 时 间 
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图 3-8 sleep() 和 wakeup() 


pri 表示 执行 优先 级 ， 将 被 赋 给 执行 进程 的 proc.p_pri。 这 个 值 代表 
进程 被 唤醒 时 的 执行 优先 级 。 


当 pri 的 值 大 于 等 于 0 时 ， 在 执行 进程 发 生 切 换 之 前 ， 以 及 该 进程 再 次 
被 选择 为 执行 进程 之 后 将 对 信号 〈 参 见 第 6 章 ) 进行 处 理 ， 小 于 0 时 则 
忽略 信号 对 其 不 作 处 理 。 此 外 ， 当 pri 的 值 大 于 等 于 0 时 ， 进 程 将 被 设 
置 为 SNAIT 状态 ， 小 于 0 时 将 被 设置 为 SSLEEP 状态 〈 表 3-3 ) 。 这 两 








种 不 同 的 状态 会 对 在 第 4 章 中 说 明 的 调度 处 理 产 生 影 啊 。 


K 3-3 pri 


























K 3-4 sleep) 的 参数 


waiting_channel。 所 等 待 资源 的 地 址 





代码 清单 3-8 sleep() (ken/slp.c) 





1 sleep(chan, pri) 

2 { 

3 register *rp, s; 

4 

5 S - PS-»integ; 

6 rp - u.u procp; 

7 

8 if(pri >= 0) ( 

9 if(issig()) 

10 goto psig; 

11 spl6(); 

12 rp-»p wchan = chan; 
13 rp-»p stat = SWAIT; 
14 rp-»p pri = pri; 

15 spl0e(); 


16 if(runin != 0) ( 


17 runin = 6; 


18 wakeup(&runin); 
19 } 

20 swtch(); 

21 if(issig()) 

22 goto psig; 

23 ) else ( 

24 spl6(); 

25 rp-»p wchan = chan; 
26 rp-»p stat = SSLEEP; 
27 rp-»p pri = pri; 

28 sple(); 

29 swtch(); 

30 } 

31 

32 PS-»integ = s; 

33 return; 

34 psig: 

35 aretu(u.u qsav); 

36 





5 保存 PSW 的 当前 值 ， 为 进程 的 下 次 执行 做 准备 。PS 指向 PSW 
所 映射 的 地 址 (代码 清单 3-9) 。 


代码 清单 3-9 PS(param.h) 


1 #define PS 0177776 





6 将 rp 设置 为 proc[] 中 代表 执行 进程 的 元 素 。 


8-22 如果 执 行 优先 级 大 于 等 于 0， 在 入 睡 和 被 唤醒 时 对 信和 号 进行 
处 理 。 首 先 使 用 issig() 判断 是 否 收 到 信号 ， 如 果 收 到 了 信号 则 
跳 转 到 psig 对 其 进行 处 理 。aretu(u.u_qsav) 的 含义 在 第 6 章 进 
行 说 明 。 


设 定 执行 进程 的 proc.p_wchan、proc.p_stat fll proc.p pri. 
由 于 在 发 生 中 断 时 被 调用 的 wakeup() 中 也 有 可 能 修改 这 些 数据 ， 
此 处 将 处 理 器 优先 级 提升 到 6 以 防止 中 断 的 发 生 。 关 于 处 理 器 优先 
级 和 中 断 请 参见 第 5 章 的 说 明 。 设 定 结束 后 再 将 处 理 器 优先 级 重 置 
为 0。 如 果 标 识 变量 runin 为 1〈 表 示 不 存在 需要 被 换 出 至 交换 空 








间 的 对 象 》， 则 局 动 进程 调度 和 如。 关于 标识 变量 runin 和 进程 调 
度 器 请 参见 第 4 半 的 说 明 。 最 后 调用 swtch() 切换 执行 进程 。 


23-30 ”此 处 为 执行 优先 级 小 于 0 时 的 处 理 。 在 进行 与 11~15 行 相 
同 的 处 理 后 《但 是 状态 变 为 SSLEEP) ， 调 用 swtch() 切换 执行 进 
程 。 





32-33 ”为 了 再 次 执行 被 中 断 的 进程 ， 恢 复 在 第 5 行 被 保存 的 
PSW。 


swtch() 


swtch() 十 用 来 切换 执行 进程 的 函数 代码 清单 3-10 ) o CDE 
edi ]， 选 择 处 于 可 执行 状态 ,并 且 执 行 优 先 级 最 高 的 进程 作为 新 的 执 
行进 程 。 


内 核 中 有 很 多 处 理 都 是 从 起 始 位 置 裔 历 proc[]， 而 swtch() 是 从 代表 
当前 执行 进程 的 元 素 位 置 开 始 遍 历 proc[]。 如 果 存 在 2 个 以 上 具有 最 
高 执行 优先 级 的 进程 ， 位 于 对 应 执行 进程 的 元 素 后 方 ， 并 且 离 它 最 近 的 
那个 元 素 〈 进 程 ) 将 被 优先 选择 CF 3-9 ) 。 














procl] 


执行 进程 


€; 


图 3-9 ”以 执行 进程 为 起 点 循环 一 周 








选择 进程 后 ， 进 行 下 述 处 理 以 切换 执行 进程 。 


。 修改 内 核 APR， 使 得 被 选择 进程 的 user 结构 体 可 以 通过 u 进行 访 
问 
e 恢复 在 被 选择 进程 的 user 结构 体 中 保存 的 r5、r6 的 值 
e 恢复 在 被 选择 进程 的 user 结构 体 中 保存 的 用 户 APR 的 值 
swtch() 执行 结束 后 ， 被 选择 的 进程 将 返回 到 调用 savu() 以 保存 
r5. r6 的 函数 自身 被 调用 的 位 置 4， 前 面 提 到 的 “利用 fork() 生成 的 
进程 从 newproc() 返回 1” 的 原因 也 在 于 此 ”。 


4 即 返回 到 savu() 的 调用 者 的 调用 者 。 一 — 译 者 注 








Cn 


























此 处 逻辑 有 点 跳跃 ， 加 以 说 明 : 父 进程 由 newproc() 生成 子 进程 后 ， 父 进程 通过 
ewproc() 的 return 6 直接 返回 ， 则 newproc() 的 调用 者 fork() 获得 返回 值 0; 而 子 进 
时 通过 swtch() 切换 上 台 ，swtch() 的 返回 值 为 1， 返 回 到 "savu() 的 调用 者 的 调用 者 "， 
Bl fork()， 则 fork() 获得 返回 值 1。 审 校 者 注 
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代码 清单 3-10 swtch() (ken/slp.c) 





static struct proc *p; 


register struct proc *rp; 


if(p -- NULL) 
p = &proc[0]; 


1 
2 
3 
4 register i, n; 
5 
6 
7 
8 


9 

10 savu(u.u rsav); 
11 retu(proc[0].p addr); 
12 

13 loop: 

14 runrun = ð; 

15 rp = p; 

16 p = NULL; 

17 n - 128; 

18 

19 i = NPROC; 

20 do { 


21 rpt; 


22 if(rp >= &proc[NPROC]) 

23 rp = &proc[0]; 

24 if(rp-»p stat--SRUN && (rp-»p flag&SLOAD)!-0) { 
25 if(rp-»p pri « n) ( 

26 p = rp; 

27 n = rp-»p pri; 

28 } 


} 
30 ) while(--i); 


32 if(p == NULL) { 
33 p = rp; 

34 idle(); 

35 goto loop; 
36 } 

37 rp = p; 

38 curpri = n; 


40 retu(rp-»p addr); 
41 sureg(); 


43 if(rp-»p flag&SSWAP) { 
44 rp-»p flag =& -SSWAP; 
45 aretu(u.u ssav); 

46 ) 


48 return(1); 











7-8 p 是 遍历 proc[] 时 所 使 用 的 static 变量 。 它 保存 着 上 次 执 
ÍT swtch() 时 选择 的 进程 (执行 进程 》 所 指 癌 的 proc[] 的 元 素 。 
初次 执行 swtch() 时 p 的 值 为 NULL， 指 向 proc[] 的 起 始 位 置 。 


10 执行 savu() 将 r5、r6 的 当前 值 保存 于 待 中 断 进程 的 
user.u rsav 之 中 。 等 到 该 进程 再 次 执行 时 再 予以 恢复 。 


11 执行 retu() 切换 至 调度 器 进程 。proc[8] 是 供 调度 器 使 用 的 
系统 进程 ， 在 系统 启动 时 被 创建 。 


14 将 标志 变量 runrun 设 定 为 0， 该 标志 变量 表示 与 执行 进程 相 
比 ， 存 在 执行 优先 级 更 高 的 进程 (代码 清单 3-11) 。 因 为 即将 切换 
到 拥有 最 高 执行 优先 级 的 进程 ， 在 此 将 runrun 重 置 为 0。 








代码 清单 3-11 runrun (system.h) 


1 char runrun; 


15-17 初始 化 工作 变量 。n 是 用 来 管理 进程 执行 优先 级 最 大 值 的 
局 部 变量 。 因 为 最 低 的 执行 优先 级 (proc.p_pri 具有 最 大 值 ) 为 
127， 在 此 代入 一 个 更 大 的 值 128 作为 初始 值 。 
19-30 WJ proc[]， 寻 找 满 足下 述 条 件 的 进程 。 

e 可 执行 状态 CSRUND 

e 存在 于 内 存 中 (SLOAD) 

。 执 行 优 先 级 最 高 (proc.p_pri 具有 最 小 值 ) 
如 果 不 存 在 处 于 可 执行 状态 的 进程 ，p 保持 初始 值 NULL 不 变 。 


32~36 ”如 果 不 存 在 可 执行 的 进程 ， 将 p 设置 为 与 此 前 的 执行 进程 
相对 应 的 proc[] 元 素 。 然 后 调用 idle()， 等 待 由 于 发 生 中 断 而 
出 现 的 可 执行 进程 。 


举例 来 说 ， 读 取 块 设备 的 处 理 结束 时 将 引发 中 断 ， 使 得 等 待 该 处 理 
结束 的 进程 被 唤醒 ， 因 此 出 现 了 处 于 可 执行 状态 的 进程 。 再 比如 ， 
由 时 钟 引 发 的 中 断 导 致 设 定 在 某 个 时 刻 局 动 的 进程 被 唤醒 的 情况 也 
是 如 此 。 中 断 处 理 结束 后 ， 从 wait 的 下 一 条 指令 开始 继续 执行 ， 
并 从 idle() 返回 swtch()。 随 后 返回 到 标签 loop 的 位 置 ， 再 次 
尝试 选择 执行 进程 。 

37~38 ”由 于 执行 进程 已 被 决定 ， 将 该 进程 代入 rp， 并 将 该 进程 的 
执行 优先 级 保存 至 curpri。curpri 为 全 局 变量 ， 用 于 保存 当前 被 
执行 进程 的 执行 优先 级 《代码 清单 3-12) 。 


代码 清单 3-12 curpri (system.h) 


1 char curpri; 














40-41 执行 retu() 恢复 被 选择 进程 的 r5、r6， 并 变更 内 核 APR 
的 值 使 u TRIS user 结构 体 。 接 着 执行 sureg() 将 保存 于 被 选择 进 
程 的 user 结构 体 中 的 APR 的 值 恢复 到 硬件 的 用 户 APR， 以 切换 
用 户 空间 。 至 此 执行 进程 的 切换 过 程 结束 。 


43-46 如果 SSWAP 标志 位 为 1， 将 其 清 0 并 从 user.u_ssav 中 恢 
复 r5、r6 的 值 。 之 所 以 这 样 做 ， 是 因为 当 由 于 调度 器 以 外 的 原因 导 
致 数据 被 换 出 内 存 时 ， 将 SSWAP 标志 位 设置 为 1。 这 意味 着 首先 将 
调用 xswap() 进行 换 出 处 理 ,随后 执行 swtch() 切换 执行 进程 。 

在 swtch() 的 第 10 行 执行 savu(u.u_rsav) HJ, 因为 user 结构 
体 已 被 换 出 至 交换 空间 ,所 以 此 处 的 savu() 将 失去 意义 。 因 此 ， 
解决 办 法 是 在 交换 处 理 前 首先 执行 savu(u.u_ssav), 当 再 次 执行 
进程 时 再 恢复 user.u ssav 中 保存 的 有 效 值 。1 


48 ”返回 1。 返 回 位 置 为 执行 savu() 的 函数 (该 函数 调用 
~o 并 在 user 结构 体 中 保存 r5、r6 的 值 ) 自身 被 调用 的 位 


























1 这 里 对 savu(u.u _ ssav) 的 作用 做 进一步 说 明 : 

1. savu(u.u _ ssav) 用 来 保存 寄存 器 r5、r6 的 值 。 之 后 可 以 使 用 aretu() 来 恢复 所 保存 的 
值 ， 并 返回 savu() 的 调用 者 的 调用 者 。 
2. swtch() 的 第 45 行 调用 了 aretu()， 考 虑 到 在 swtch() 之 前 执行 的 xswap() 进行 换 出 操 
aretu() 所 恢复 的 r5、r6 的 值 需要 在 调用 xswap() 之 前 通过 savu(u.u _ ssav) 进行 保 
do 

3. 3.2 节 给 出 的 newproc() 的 第 62 行 执行 了 xswap()， 并 在 此 之 前 的 第 61 行 执 行 了 
savu(u.u | ssav). {HE newproc()-» xswap()-» swap()-» sleep()-> 进程 下 台 -> 经 
swtch() 切换 该 进程 再 次 上 人 台 的 这 个 过 程 中 ， 由 于 下 述 两 点 原因 不 会 引起 换 出 操作 。 因 此 此 
处 的 savu(u.u _ ssav) 其 实 并 不 需要 在 xswap() 之 前 被 执行 。 
a. 当前 进程 是 生成 的 子 进程 ， 还 没有 置 SSWAP 标志 ， 不 会 被 换 出 
b. 父 进程 被 置 SIDL 不 能 被 选择 上 台 
4. 在 上 述 第 3 点 中 ， 由 于 swtch() 的 第 45 行 调用 了 aretu()， 控 制 权 会 返回 savu() 的 调用 
zt (HU newproc()) 的 调用 者 。 一 一 审 校 者 注 















































































































































swtch() 的 返回 位 置 
函数 调用 


这 部 分 对 “swtch() 的 返回 位 置 为 执行 savu() 的 函数 自身 被 调用 的 位 
置 ” 进 行 说 明 。 





在 进入 正题 前 ， 首 先 需要 对 函数 调用 时 进程 栈 的 行为 有 所 了 解 。 由 于 使 
用 的 编译 器 等 原因 ， 栈 的 行为 会 有 所 不 同 ， 此 处 以 示例 程序 在 UNIX 
Ve 上 的 运行 情况 为 基础 进行 说 明 。 

假设 有 如 代码 清单 3-13 所 示 的 示例 程序 。 


代码 清单 3-13 示例 程序 


callee(a, b) { 


3 


f, result; 


result = callee(e, f); 
return result; 





在 此 程序 中 caller 函数 调用 了 callee 函数 。 上 述 代码 在 UNIX V6 模 
拟 器 上 经 过 编译 生成 如 代码 清单 3-14 所 示 的 汇编 代码 。 


代码 清单 3-14 经 过 编译 的 示例 程序 





1.globl  callee 

2 .text 

3 callee: 

4 ~~callee: 

5 ~a=4 

6 ~b=6 

7 «c-177770 

8 «d-177766 

9 jsr r5,csv 
10 sub $4,sp 
11 mov A(r5), -10(r5) 
12 mov 6(r5),-12(r5) 
13 mov -10(r5),r0 
14 add -12(r5),r0 


15 jbr L1 


16 L1:jmp cret 

17 .globl caller 
18 .text 

19 caller: 

20 ~~caller: 

21 -result-177764 
22 »e-177770 


23 —f-177766 

24 jsr r5,csv 

25 sub $6,sp 

26 mov $1,-10(r5) 
27 mov $2, -12(r5) 
28 mov -12(r5), (sp) 
29 mov -10(r5),-(sp) 
30 jsr pc,*$ callee 
31 tst (sp) 

32 mov r6, -14(r5) 
33 mov -14(r5),r0 
34 jbr L2 

35 L2:jmp cret 

36 .globl 

37 .data 





caller() 调用 callee() 的 位 置 如 代码 清单 3-15 所 示 。 
代码 清单 3-15 ”调用 callee() 的 位 置 


28 mov -12(r5),(sp) 
29 mov -10(r5),-(sp) 


30 jsr pc,*$ callee 





将 传递 给 callee() 的 参数 压 入 栈 后 ， 通 过 jsr 指令 跳 转 至 
callee(). jsr 指令 的 第 一 个 参数 被 压 入 栈 。 此 处 被 压 入 栈 的 pc 的 值 
将 成 为 从 callee() 返回 的 位 置 。jsr 指令 的 第 二 个 参数 为 pc 的 新 
值 ， 控 制 权 同时 被 移交 给 callee() ( 表 3-5 ) 。 


表 3-5 控制 权 被 移交 给 callee() 时 栈 的 状态 


| 


-> pc 《从 callee() 返回 的 位 置 ) 





callee() 获得 控制 权 后 ， 首 先 执行 csv〔 代 码 清 单 3-16 ) 。 
代码 清单 3-16 csv 


csv 函数 用 于 向 栈 压 入 r2、r3 和 r4 的 值 ， 采 用 汇编 语言 编写 (代码 清 
H8 3-172 . 





代码 清单 3-17 csv Cconf/m40.s) 





执行 csv 后 控制 权 返 回 callee() 时 的 栈 状态 如 表 3-6 所 示 。 
K 3-6 执行 csv 后 的 栈 状态 











a pc( 从 csv 返回 的 位 置 。 通 常 不 使 用 ) 


IH r2 f& 




















栈 中 保存 了 传递 给 函数 的 参数 ， 从 函数 返回 时 的 位 置 ， 以 及 调用 函数 时 
I2. r3. r4. r5 的 当前 值 。r5 的 最 新 值 则 指向 保存 在 栈 中 的 旧 的 5 值 。 


在 callee() 内 使 用 的 局 部 变量 也 通过 栈 进 行 管理 。 函 数 的 参数 和 局 部 
变量 通过 r5 进行 访问 ( 表 3-7， 代 码 清单 3-18 . 


代码 清单 3-18 通过 r5 访问 函数 的 参数 和 局 部 变量 


11 mov A(r5), -10(r5) 
12 mov 6(r5),-12(r5) 


363-7 局 部 变量 


局 部 变量 


部 变量 1 -10(r5) 


























返回 的 位 置 ) 























随后 ，callee() 的 内 部 处 理 继 续 运 行 ， 将 返回 值 存 放 于 r0 之 后 执行 
cret (代码 清单 3-19 ) 。 


代码 清单 3-19 callee() 的 返回 位 置 


-10(r5),r0 
-12(r5),r0 


L1 
cret 








cret 是 恢复 保存 在 栈 中 的 寄存 器 数据 的 函数 〈 代 码 清单 3-20 ) 。 


代码 清单 3-20 cret (conf/m40.s) 


1 .globl cret 
2 cret: 


3 mov r5,r1 

4 mov -(r1),r4 
5 mov -(r1),r3 
6 mov -(r1),r2 
7 mov r5,sp 

8 mov (sp)+,r5 
9 rts pc 





恢复 保存 在 栈 中 的 r5、I4、r3、z2 的 值 ， 同 时 调整 sp 使 之 指向 调用 函 
数 时 保存 的 pc 的 值 ( 表 3-8 ) 。 当 rts 指令 的 参数 为 pc 时 ， 将 跳 转 到 
sp 所 指向 的 值 。 


表 3-8 cret 的 rts 指令 执行 前 的 栈 状态 


变量 





局部 
ut AE 





pc OA csv 返回 的 位 置 ) 


IHE r2 值 恢复 至 r2 








至 此 控制 权 从 返回 caller()，caller() Ñ ro 访问 
callee() 的 返回 值 并 继续 自身 的 运行 。 


此 外 ， 栈 中 保存 的 位 于 sp 所 指 位 置 以 上 的 数据 不 会 被 删除 。 这 些 数 据 
通常 不 会 被 再 次 使 用 ， 在 使 用 新 的 局 部 变量 ， 或 发 生 函 数 调用 时 将 被 覆 


ES 
栈 上 以 函数 调用 为 单位 进行 管理 的 数据 被 称 为 帧 ，r5 指向 与 调用 者 函数 


相对 应 的 帧 内 的 区。 通过 遍历 r5, 就 可 以 遍历 所 有 作为 调用 者 的 函数 , 因 
此 r5 被 称 为 帧 指针 或 者 环境 指针 (图 3-10 ) 。 








return address 


参数 





图 3-10 Witt 


savu() 


根据 如 上 上 所 述 的 栈 行为 ， 再 看 一 下 执行 savu() CX 3-10， 代 码 清单 3- 

21) 时 所 发 生 的 处 理 。 被 中 断 的 进程 执行 savu() Ff r5 和 6 的 当前 值 

保存 于 user 结构 体内 。savu() 的 参数 为 

u.u rsav[]. u.u ssav[]. u.u qsav[] 其 中 之 一 的 地 址 。r5 fI r6 的 
当前 值 将 保存 于 该 地 址 。 


savu() 获得 控制 权时 的 栈 状态 如 表 3-9 所 示 。 





表 3-9 savu() 获得 控制 权时 的 栈 状态 
| 
pc( 从 savu() 返回 的 位 置 ) 











参数 (u.u_rsav, u.u ssav, u.u qsav 其 中 之 一 ) 





K 3-10 savu() 的 参数 








代码 清单 3-21 savu() (conf/m40.s) 





1 

2 bis $340,PS 
3 mov (sp)*,r1 
4 mov (sp),re 
5 mov sp, (re)+ 
6 mov r5, (re)+ 
7 bic $340,PS 
8 jmp (r1) 


2 将 处 理 器 优先 级 设置 为 7， 以 防止 发 生 中 断 。 


3-4 将 pc 保存 在 rl 中 (此 处 的 pc 指向 从 savu() 返回 的 位 
置 ) ， 将 参数 保存 在 r0 中 ( 表 3-11) 。 


表 3-11 保存 r5、r6 





5~6 将 r5 和 fr6 的 当前 值 保 存在 作为 参数 收 到 的 数组 


u.u rsav. u.u ssav Bk u.u qsav 中 。 
7 将 处 理 器 优先 级 恢复 为 0。 
A 将 r1 设置 为 从 savu() 返回 的 位 置 ， 使 用 jmp 指令 跳 转 到 该 位 


retu(). aretu() 

切换 进程 时 将 执行 retu() (X 3-13， 代 码 清单 3-22 ) . retu() 操作 
内 核 APR， 将 u 指 问 user 结构 体 ， 随 后 从 u.u rsavE] 中 恢复 rz5 和 
r6 的 值 。 


retu() 的 参数 为 执行 进程 的 proc.p_addr。user 结构 体位 于 这 个 地 
址 的 起 始 位 置 。retu() 获得 控制 权时 的 栈 状态 如 表 3-12 所 示 。 


K 3-12 retu() 获得 控制 权时 的 栈 状态 


| 


-> pc (从 retu() 返回 的 位 置 ) 





m 参数 (执行 进程 的 proc.p addr) 


K 3-13 retu( 的 参数 




















$340,PS 

(sp)+,r1 

(sp),re 
1f 


$340,PS 
(sp)+,r1 
(sp),KISA6 
$_u ro 


(re)+, sp 
(r@)+,r5 
$340,PS 
(r1) 





8 将 处 理 器 优先 级 设置 为 7， 以 防止 发 生 中 断 。 
9 将 返回 位 置 的 地 址 保存 在 r1 中 。 
10 ”将 参数 proc.p_addr 保存 在 KISA6 中 。KISA6 表示 内 核 


PAR6 的 地 址 (代码 清单 3-23) 。 这 样 就 可 以 通过 u 来 访问 被 选择 
的 进程 的 user 结构 体 了 。 


代码 清单 3-23 KISAG (conf/m40.s) 


1 KISA6 - 172354 


11 将 user 结构 体 的 头 部 保存 在 r0 Fo user 结构 体 的 头 部 为 
u rsav 的 定义 《代码 清单 3-24) 。 


代码 清单 3-24 user 结构 体 的 头 部 
1 struct user 
2í( 
3 int u rsav[2]; 
13~14 将 r6 设置 为 u.u_rsav[8] 的 值 ，r5 V H7J u.u rsav[1] 
的 值 ， 以 此 恢复 r5 和 6 的 数据 。 
15 将 处 理 右 优先 级 恢复 为 0。 
16 使 用 jmp 指令 从 retu() 返回 
下 面 来 看 一 下 aretu() 的 定义 CR 3-14) 。aretu() 的 参数 为 
u.u ssav[] 或 u.u qsav[] 的 地 址 。aretu() 从 接收 到 的 参数 中 获取 
r5 M r6 的 值 并 恢复 到 寄存 器 中 。 该 函数 与 retu() 的 区 别 在 于 不 对 
APR 进行 操作 ， 因 此 u 指向 的 user 结构 体 不 会 发 生 切 换 。 


K 3-14 aretu() 的 参数 





u.u_ssav EX u.u qsav 的 地 址 。 从 中 获取 r5 和 6 的 值 用 于 恢复 寄存 器 


aretu() 获得 控制 权时 的 栈 状态 如 表 3-15 所 示 。 
K 3-15 aretu() 获得 控制 权时 的 栈 状态 








sp 值 





参数 Cu.u ssav EX u.u qsav 的 地 址 ) 





2 将 处 理 器 优先 级 设置 为 7， 以 防止 发 生 中 断 。 


3-4 将 返回 地 址 保存 在 rL， 参 数 保存 在 ro 中 。 之 后 的 处 理 与 
retu() 相同 ， 从 u.u_ssav 或 u.u_qsav 中 获取 r5 FI r6 的 值 并 恢 
复 寄 存 器 


至 此 ， 利 用 retu() 或 aretu() 恢复 了 r5 和 Fr6 的 值 ， 执 行 savu() 时 
的 栈 状态 也 得 以 复原 〈 表 3-16 ) 。 


K 3-16 retu(). aretu() 执行 后 的 栈 状态 




















局 部 变量 


Æ 1 
pe CA csv 返回 的 位 置 ) 


的 r2 值 











的 r3 值 





的 r4 值 





r5 旧 的 r5 值 














pc WRH savu() 的 函数 返回 的 位 置 ) 





此 时 执行 cret 指令 ， 将 恢复 栈 内 保存 的 r2~r5 的 值 ， 并 返回 到 savu() 
的 调用 者 的 调用 者 。 


如 上 所 述 ， 在 执行 retu()、aretu() 后 再 执行 return (=cret) ,将 从 
调用 savu() 的 函数 中 返回 





setpri() 


setpri() 用 于 更 新 进程 的 执行 优先 级 Cproc.p pri?) (Æ 3-17, 4X 

码 清单 3-26 ) 。 在 发 生 时 钟 中 断 或 处 理 信 号 时 执行 setpri()， 定 期 更 
setpri() 的 参数 为 proc [ ] 的 元 素 ， 该 元 素 对 应 更 新 

对 象 进程 。 


赋予 proc.p pri 的 新 值 为 PUSER+ 
(proc.p_cpu/16)+proc.p_nice， 但 最 大 值 为 127。 请 注意 ， 
proc.p_pri 的 值 越 小 ,执行 优先 级 越 高 。 

PUSER 的 值 被 定义 为 100〈 代 码 清单 3-25 ) 。 


代码 清单 3-25 PUSER (param.h) 





1 #define PUSER 100 


proc.p cpu 为 该 进程 占有 CPU 的 总 时 间 ， 在 进程 运行 过 程 中 会 随 着 时 
钟 中 断 而 递增 。 但 是 ， 当 进程 从 交换 空间 换 入 内 存 时 ， 该 值 被 重 置 为 
0。CPU 的 占有 时 间 越 长 ,进程 的 执行 优先 级 越 低 。 


proc.p nice 在 用 户 执行 系统 调用 nice 时 被 设 定 ， 且 总 为 正 值 。 该 值 








用 来 调 低 执行 优先 级 。 但 也 有 例外 ， 超 级 用 户 〈 参 考 第 9 380. 可 以 将 其 
设 为 负 值 。 


K 3-17  setpri() 的 参数 








代码 清单 3-26 setpri() (ken/slp.c) 


etpri(up) 
register *pp, p; 
pp = up; 


p = (pp-»p cpu & 0377)/16; 
p =+ PUSER + pp-»p nice; 


if(p » 127) 
p = 127; 
if(p » curpri) 
runrun++; 
pp->p_pri = p; 





6~9 计算 执行 优先 级 。 


10~11 curpri 为 当前 执行 中 的 进程 的 执行 优先 级 。 标 志 变 量 
runrun 表示 存在 执行 优先 级 大 于 当前 进程 的 其 他 进程 。 因 为 
proc.p pri 的 值 越 小 执行 优先 级 越 高 ,所 以 此 处 的 不 等 号 实际 上 
是 错误 的 ， 这 个 错误 在 UNIX 的 下 一 个 版 本 中 已 被 修正 。 





wakeup() 


wakeup() W) proc[] 的 元 素 ， 唤 醒 因 为 等 待 由 该 函数 的 参数 所 指定 
的 资源 而 处 于 休眠 状态 的 进程 〈 表 3-18， 代 码 清单 3-27 ) 。 


K 3-18 wakeupO 的 参数 








waiting_channel。 进 程 等 待 的 资源 的 地 址 





代码 清单 3-27 wakeup() (ken/slp.c) 


wakeup(chan) 

{ 
register struct proc *p; 
register c, i; 


chan; 
&proc[0]; 
NPROC; 


do { 
if(p-»p wchan == c) { 
setrun(p); 
} 
p++; 
) while(--i); 





6-14 ”从 起 始 位 置 遍历 proc[]， 对 于 与 proc.p_wchan 参数 值 相 
同 的 进程 ， 可 执行 setrun() 将 其 设 定 为 可 执行 状态 。 


setrun() 


setrun() 将 由 参数 指定 的 进程 设 定 为 可 执行 状态 CSRUN) CX 3-19, 
代码 清单 3-28 ) 。 


K 3-19 setrun() 的 参数 

















p 设 定 对 象 进程 的 proc 结构 体 


代码 清单 3-28 setrun() (ken/slp.c) 


etrun(p) 


register struct proc *rp; 


rp = P; 
rp->p_wchan = 6; 
rp->p_stat = SRUN; 


if(rp->p_pri < curpri) 
runrun++; 

if(runout != 0 && (rp->p_flag&SLOAD) == 0) { 
runout = 0; 
wakeup(&runout); 





6 由 于 已 从 休 眼 状态 被 唤醒 ， 因 此 将 proc.p wchan EEN 0. 
7 将 proc.p_stat 置 为 SRUN 使 进程 成 为 可 执行 状态 。 


8~9 ”如 果 比 执行 进程 的 执行 优先 级 高 ， 则 设置 标志 变量 runrun。 
被 唤醒 的 进程 的 执行 优先 级 由 使 之 入 睡 的 sleep() 设 定 。 


10-13 标志 变量 runout 表示 当前 不 存在 可 由 交换 空间 换 入 内 存 

的 进程 。 如 果 已 经 设置 了 runout， 而 被 唤醒 的 进程 已 位 于 交换 空 

间 ， 则 说 明 可 能 允许 将 其 他 进程 换 入 内 存 ， 因 此 ， 此 处 将 标志 变量 
runout 重 置 为 0， 并 启动 调度 器 。 关 于 调度 器 的 详细 介绍 请 见 第 4 
章 。 


3.4 执行 程序 


执行 程序 时 ， 首 先 需 要 将 该 程序 的 执行 文件 从 块 设 备 读 取 至 内 存 ， 并 将 
其 配置 到 执行 进程 的 虚拟 地 址 空间 中 。 


系统 调用 exec 用 于 执行 程序 执行 文件 的 读 入 处 理 和 分 配 内 存 的 处 理 。 


系统 调用 exec 不 会 改变 已 打开 文件 和 当前 目录 的 数据 。 父 进程 的 数 
气 按 原状 保留 。 


程序 执行 文件 的 格式 


系统 调用 exec 的 重要 处 理 之 一 是 读 取 程序 的 执行 文件 。 本 节 将 介绍 
UNIX V6 程序 执行 文件 〈a.out) 的 格式 。 


程序 执行 文件 从 文件 头 开 始 依次 由 下 述 部 分 构成 。 符 号 表 (symbol 
table) 和 重 定 位 比特 Crelocation bit) 在 本 书 中 不 做 介绍 。 


PATE 

。 代码 〈 程 序 的 指令 ) 

e 数据 (初始 值 不 为 0 的 全 局 变量 等 ) 
。 符号 表 ( 供 调试 器 等 使 用 ) 

。 重 定 位 比特 


a E E E E E 


表 3-20 程序 执行 文件 的 文件 头 



































0 魔术 数字 (0407. 0410. 0411 其 中 之 一 ) 


符号 表 长 度 
条 目的 起 始 位 置 (始终 为 0) 
i 





魔术 数字 为 0407 的 程序 在 存在 多 个 进程 时 不 共 人 至 代码 段 。 程 序 执 行文 
件 的 代码 和 数据 一 起 读 取 至 进程 的 数据 区 域 (图 3-11) 。 


user.u dsize 


数据 段 





参数 压 入 栈 ) user.u_ssize 
Oxffff 


图 3-11 魔术 数字 0407 


魔术 数字 为 0410 的 程序 在 存在 多 个 进程 时 共享 代码 段 。 程 序 执行 文件 

的 代码 部 分 读 取 到 进程 的 代码 段 中 ， 数 据 部 分 读 取 到 进程 的 数据 区 域 。 

读 取 的 数据 部 分 位 于 代码 段 之 后 ， 起 始 地 址 以 8KB 为 边界 对 齐 。8KB 

恰好 等 于 APRI 页 的 长 度 。 代 码 段 和 数据 区 域 分 别 对 应 不 同 的 APR， 

此 在 虚拟 地 址 空间 里 ， 数 据 区 域 的 起 始 地 址 也 需要 以 8KB 为 边界 对 齐 
(图 3-12 ) 。 


块 设备 虚拟 地 址 空间 
p 0 RER 


user.u tsize 


0 mod 8K 0 mod 8K 


user.u dsize 


数据 段 





图 3-12 ”魔术 数字 0410 


魔术 数字 为 0411 的 程序 在 PDP-11/40 的 环境 中 未 投入 使 用 ， 因 此 本 书 
中 也 直接 省 略 。 


bss 代表 初始 值 为 0 的 数据 。 因 为 已 知 初始 值 为 0， 程序 执行 文件 中 并 
没有 为 其 分 配 相应 的 空间 。 只 有 妆 文 件 被 读 取 到 内 存 时 才 会 分 配 供 bss 
使 用 的 空间 。 

用 户 程 序 可 以 使 用 C 函数 库 的 malloc() 函数 来 扩展 数据 区 域 。 

栈 区 域 位 于 数据 段 ， 被 赋予 地 址 空间 的 最 高 位 地 址 。 执 行 系统 调用 
exec 时 将 生成 长 度 为 20x64 字 节 的 栈 区 域 。 栈 区 域 根据 实际 情况 目 动 


扩展 。 关 于 栈 区 域 的 扩展 将 在 第 5 章 中 介绍 。 栈 区 域 也 用 于 保存 传 给 程 
序 的 参数 。 


系统 调用 exec 
系统 调用 exec 进行 的 处 理 不 仅 与 进程 管理 相关 ， 还 与 文件 系统 、 块 设 














备 IO 等 多 种 要 素 关 系 。 若 想 完全 理解 这 一 概念 ， 必 须 了 解 UNIX V6 
内 核 整 体 。 建 议 在 阅读 本 书后 复习 相关 内 容 。 


用 户 程 序 调 用 exec 后 将 执行 下 述 处 理 。 

。 将 传递 给 执行 程序 的 参数 存 入 缓冲 区 

e 将 程序 从 块 设 备 读 取 到 内 存 

。 更 新 进程 的 虚拟 地 址 空间 

。 将 存 入 缓冲 区 的 参数 压 入 栈 

。 对 SUID、SGID (参见 第 9 章 ) 进行 处 理 

e 对 寄存 器 和 信号 进行 初始 化 
exec 的 第 1 个 参数 为 一 个 字符 串 的 起 始 地 址 ， 该 字符 串 代 表 程 序 执行 
文件 路 径 ， 以 0 (NULL) 结尾 。 第 2 个 参数 为 传递 给 程序 的 参数 序列 的 
起 始 地 址 。 参 数 序列 中 各 参数 的 起 始 地 址 依次 排列 ， 以 0 结尾 。 各 个 参 
数 的 值 也 同样 以 0 结尾 。 执 行 exec 汇编 代码 的 例子 如 代码 清单 3-29 所 
zs 
代码 清单 3-29 执行 系统 调用 exec 


1 sys exec; name; args 


3 name: ...\0 
Zi 


5 args: arg0; argl; ...; We 
6 arg6: ...\6 
7 arg1: ...\6 





在 更 新 进程 的 虚拟 地 址 空间 之 后 ， 传 递 给 程序 的 参数 压 入 进程 的 栈 中 。 
从 栈 区 域 的 底部 《高 位 地 址 ) 开始 依次 是 各 参数 的 值 、-1、 各 参数 的 地 
址 、 参 数 的 数量 。 各 参数 的 值 的 结尾 字符 为 0 CNULL) 。 人 参数 的 数量 、 
各 参数 地 址 的 起 始 位 置 分 别 对 应 C 语言 程序 main(int argc, 
char**argv) 的 两 个 参数 (图 3-13 ) 。 


虚拟 地 址 空间 











参数 的 数量 
参数 0 的 地 址 


参数 n 的 地 址 
[ERE CHEN 


-1 


«— int argc 
«— char **argv 








-— 


图 3-13 传递 给 程序 执行 文件 的 参数 
可 以 同时 执行 exec 的 进程 数量 被 限制 为 NEXEC (=3 ) (代码 清单 3-30 
Duo 


代码 清单 3-30 NEXEC (param.h) 


1 #define NEXEC 3 


问 执 行程 序 传递 参数 、 将 程序 执行 文件 从 块 设 备 读 取 至 内 存 ， 这 些 处 理 
都 会 大 量 使 用 块 设备 的 缓冲 区 (参见 第 7 GR) 。 此 外 ， 在 等 待 块 设备 处 
理 完毕 的 过 程 中 切换 执行 进程 的 可 能 性 很 大 ， 考 虑 到 新 的 执行 进程 有 可 
n exec, Aij S SOC Bm C RASA. AA EN 
以 限制 。 


exec() 为 系统 调用 exec 的 处 理 函 数 〈 表 3-21， 代 码 清单 3-31 ) . mnl 
系统 调用 处 理 函 数 传递 参数 的 方法 详 见 见 第 5 章 。 





表 3-21 系统 调用 exec 的 参数 


u.u arg[0] 守 串 的 起 始 地 址 ， 该 字符 串 代 表 程 序 执行 文件 路 径 





u.u arg[1] 传递 给 程序 的 参数 序列 的 起 始 地 址 








代码 清单 3-31 exec() (ken/sysl.c) 





int ap, na, nc, *bp; 
int ts, ds, sep; 


register char *cp; 
extern uchar; 


1 
2 
3 
4 
5 register c, *ip; 
6 
7 
8 
9 


/* 正当 性 检查 */ 











10 ip = namei(&uchar, 0); 

11 if(ip -- NULL) 

12 return; 

13 while(execnt »- NEXEC) 

14 sleep(&execnt, EXPRI); 
15 execnt++; 

16 bp = getblk(NODEV); 

17 if(access(ip, IEXEC) || (ip-»i mode&IFMT)!-0) 
18 goto bad; 

19 

20 /* 将 参数 存 入 缓冲 区 */ 

21 cp = bp-»b addr; 

22 na = ð; 

23 nc = 0; 

24 while(ap = fuword(u.u arg[1])) { 
25 nac; 

26 if(ap -- -1) 

27 goto bad; 

28 u.u arg[1] =+ 2; 

29 for(;;) { 

30 c = fubyte(ap++) ; 


31 if(c == -1) 


32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
77 
78 
79 


goto 
*cp++ = C 
ncer; 
if(nc » 5 
u.u e 
goto 
j 
if(c == 0 
break 
j 
j 
if((nc&1) !- e) { 
*cprt = 0; 
ncrt; 


} 
/* 读 取 程序 执行 文人 


.U_base = &u.u a 
.U_COunt = 8; 








bad ; 


3 


10) { 
rror = E2BIG; 


bad; 


) 


3 





的 文件 头 */ 
rg[6] ; 


.u offset[0] = 6€; 


U 
U 
u.u offset[1] = 6€; 
U 
U 


.u segflg = 1; 
readi(ip); 
u.u segflg = 6; 
if(u.u error) 
goto bad; 
sep = ð; 
if(u.u arg[0] == 


0407) ( 


u.u arg[2] =+ u.u arg[1]; 


u.u arg[1] - 

) else 

if(u.u arg[0] == 
sep++; else 

if(u.u arg[0] !- 
u.u error = E 
goto bad; 

} 

if(u.u arg[1]!-e 
u.u error = E 
goto bad; 


} 


ts = ((u.u arg[1] 

ds = ((u.u arg[2] 

if(estabur(ts, ds 
goto bad; 


/* 读 取 程序 执行 文人 





ð; 
0411) 


0410) ( 
NOEXEC; 


&& (ip-»i flag&8ITEXT)--0 && ip-»i count!-1) { 


TXTBSY; 


+63)>>6) & 01777; 
*u.u arg[3]«463)»»6) & 01777; 


， SSIZE, sep)) 





F 的 代码 部 分 */ 


u.u prof[3] = ð; 
xfree(); 
expand(USIZE); 
xalloc(ip); 
C = USIZE+ds+SSIZE; 
expand(c); 
while(--c >= USIZE) 
clearseg(u.u procp-»p addr-4c); 





/* 读 取 程 序 执行 文件 的 数据 部 分 */ 
estabur(0, ds, 0, 0); 

u.u base = 6; 

u.u offset[1] = 020«u.u arg[1]; 
u.u count - u.u arg[2]; 





readi(ip); 

u.u tsize - ts; 
u.u dsize - ds; 
u.U Ssize = SSIZE; 
u.U Sep = sep; 


estabur(u.u tsize, u.u dsize, u.u ssize, u.u sep); 


/* 将 参数 压 入 栈 */ 

cp = bp-»b addr; 

ap = -nc - na*2 - 4; 

u.u_arð[R6] = ap; 

suword(ap, na); 

c = -ncj 

while(na--) { 
suword(ap=+2, c); 
do 

subyte(c++, *cp); 

while(*cp++); 

} 


suword(ap*2, -1); 


/* 设置 SUID、SGID */ 
if ((u.u procp-»p flag&STRC)--0) ( 
if(ip-»i mode&ISUID) 
if(u.u uid !- 0) ( 
u.u uid = ip-»i uid; 
u.u procp-»p uid - ip-»i uid; 





} 
if(ip->i mode&ISGID) 
u.u gid = ip->i gid; 








/* 清空 信号 和 寄存 器 */ 

















128 c = ip; 


129 for(ip = &u.u signal[0]; ip < &u.u signal[NSIG]; ip++) 
130 if((*ip & 1) -- 0) 

131 *ip = 0; 

132 for(cp = &regloc[0]; cp « &regloc[6];) 

133 u.u are[*cpe«] = 6€; 

134 u.u are[R7] = ð; 

135 for(ip = &u.u fsav[0]; ip « &u.u fsav[25];) 
136 *iprt = 6; 

137 ip = C; 

138 

139 bad: 

140 iput(ip); 

141 brelse(bp); 

142 if(execnt >= NEXEC) 

143 wakeup(&execnt); 

144 execnt--; 





10-12 ”通过 用 户 作 为 参数 指定 的 程序 执行 文件 的 路 径 ， 取 得 
inode[] 中 对 应 的 该 文件 的 元 素 。 如 果 用 户 指定 了 不 存在 的 文件 路 
径 ， 或 是 不 具备 访问 该 文件 的 权限 时 ，namei() 将 返回 NULL. 


13~15 确认 正在 执行 的 exec() 的 进程 数 小 于 NEXEC。 如 果 大 于 
或 等 于 NEXEC 则 调用 sleep() 进入 睡眠 状态 ， 直 到 正在 执行 的 
exec() 的 进程 数 小 于 或 等 于 NEXEC。 通 过 此 处 的 检查 后 递增 
execnt 的 值 ， 表 示 正 在 执行 exec() 的 进程 数 又 增加 了 1 

个 。execnt 为 全 局 变量 〈 代 码 清 单 3-32) 。 


代码 清单 3-32 execnt (system.h) 


16 执行 getblk() 取得 尚未 被 分 配给 其 他 块 设备 的 块 设备 绥 冲 
区 ， 并 将 其 作为 处 理 参数 时 的 工作 内 存 。 大 概 开发 人 员 认 为 与 通过 
malloc() 和 mfree() 分 配 内 存 相 比 ， 这 种 做 法 更 简单 。 


17~18 执行 access() 检查 程序 文件 的 执行 权限 ， 同 时 确认 该 文 
件 不 是 特殊 文件 。 


21-23 ”将 传递 给 程序 的 参数 存 入 刚才 取得 的 缓冲 区 。 首 先 将 cp 设 
定 为 缓冲 区 数据 区 域 的 地 址 ， 然 后 将 na 参数 的 数量 ) 和 nc C2 
ZU ESO i. 


24 依次 处 理 用 户 传递 给 程序 的 参数 。fuword() 是 从 上 一 模式 所 
示 的 虚拟 地 址 空间 向 当前 模式 所 示 的 虚拟 地 址 空间 复制 的 1 个 字 长 
的 数据 。u.u_arg[1] 此 时 为 系统 调用 exec 的 第 2 个 参数 的 地 
址 。 


25 每 处 理 1 个 参数 ，na 都 会 加 1。 当 这 个 while 处 理 结束 
时 ，na 的 值 等 于 参数 的 数量 。 


26-27 fuword() 处 理 失败 时 返回 -1， 此 时 跳 转 到 bad 进行 错误 
处 理 。 


28 将 u.u_arg[1] 增加 1 个 字 以 便 访 问 下 一 个 参数 。 


29~41 ”将 参数 以 字 节 为 单位 依次 存 入 缓冲 区 ， 将 ap WEN A 
参数 的 指针 。fubyte() 与 fuword() 相似 ， 但 是 处 理 单位 为 1 个 
字 节 。 参 数 以 字 节 为 单位 存 入 缓冲 区 。fubyte() 发 生 错误 时 返回 
-1， 此 时 跳 转 到 bad 进行 错误 处 理 。 


每 处 理 1 个 字 节 ，nc 都 会 加 1。 当 这 个 while 处 理 结束 时 ，nc 的 
值 等 于 参数 的 总 字 节 数 。 因 为 缓冲 区 的 长 度 只 有 512 字 节 ， 当 nc 
大 于 510 时 将 认为 参数 的 长 度 过 长 ， 此 时 跳 转 到 bad 进 行 错误 处 
T. 


由 于 各 参数 都 以 0 (NULL) 结尾 ， 因 此 当 fubyte() 取得 的 值 为 0 
时 ， 转 而 处 理 下 一 个 参数 。 当 存 入 缓冲 区 的 处 理 结束 后 ， 缓 冲 区 中 
保存 的 数据 形式 为 “参数 0 参数 1... 参数 n”。 


43-46 当 nc 的 值 为 奇数 时 ， 同 缓冲 区 中 追加 1 个 字 节 使 数据 长 度 
成 为 偶数 。 因 为 系统 希望 以 字 为 单位 进行 处 理 。 


49~53” 读 取 程序 文件 的 文件 头 。readi() 是 用 于 读 取 文件 内 容 的 
函数 ， 其 参数 由 user 结构 体 指定 (K 3-22) 。 


表 3-22 readi() 的 参数 














用 于 保存 读 取 数 据 的 地 址 
m 8 字 节 (4 个 字 ) 








tt ie CD ， 或 是 读 取 到 用 户 空间 (0) 


56~57 如果 readi() 在 执行 中 发 生 错误 ， 将 错误 代码 保存 至 
u.u_error， 并 跳 转 到 bad 进行 错误 处 理 。 


通过 readi() 读 取 的 数据 ， 以 表 3-23 所 示 的 形式 保存 于 
u.u arg[] 中 。 











K 3-23 readi() 的 执行 结 


58 将 sep 设 定 为 0。 








59-68 ”根据 魔术 数字 进行 分 支 处 理 。 魔 术 数 字 为 0407 时 不 使 用 代 


码 段 ， 而 是 将 代码 和 数据 一 并 读 取 至 数据 区 域 。 将 u.u arg[2] X 
置 为 代码 长 度 和 数据 长 上 度 之 和 ,将 u.u_arg[1] 清 0。 


如 果 磨 术 数 字 为 0407、0410、0411 以 外 的 值 则 认为 不 是 程序 的 执 
行文 件 ， 并 跳 转 到 bad 进行 错误 处 理 。 

69~72 ”如 果 代 码 的 长 度 (u.u_arg[1]) 不 为 0， 该 程序 文件 又 被 
作为 数据 文件 打开 ， 则 进行 错误 处 理 。 

74-75 “计算 代码 段 和 数据 区 域 的 长 度 。 段 的 长 度 以 64 字 节 为 单位 
进行 管理 。 


76~77 执行 estabur() 更 新 用 户 APR 和 用 户 空间 6。SSIZE 表示 
栈 区 域 的 初始 长 度 ， 被 定义 为 20 (x64 字 节 ) (代码 清单 3-33) 。 
































8 此 处 调用 estabur() 主要 是 通过 设置 APR 来 检查 各 个 段 长 度 是 否 合法 ， 之 后 会 再 次 调用 
estabur() 正式 设置 APR。 审 校 者 注 
























































代码 清单 3-33 SSIZE (param.h) 
1 #define SSIZE 20 
80 ”从 此 处 开始 进行 代码 段 和 数据 段 的 初始 化 处 理 。 首 先 将 用 于 统 
计 的 变量 清 0。 
81 执行 xfree() 释放 当前 使 用 的 代码 段 。 如 果 在 此 之 前 依次 执 
行 了 fork 和 exec， 那 么 到 此 为 止 就 终于 告别 了 父 进程 所 使 用 的 代 
码 段 。 
82 执行 expand() 将 数据 段 缩小 为 与 user 结构 体 相 同 的 长 度 。 


83 执行 xalloc() 分 配 代码 段 使 用 的 内 存 。 如 果 未 使 用 代码 段 ， 
则 在 xalloc() 中 不 做 任何 处 理 。 


84~87 ”执行 expand() 确保 数据 区 域 。 由 于 位 于 user 结构 体 之 后 
的 区 域 留 有 过 去 的 数据 ， 因 此 需要 将 其 清 0。 


90 执行 estabur()， 将 进程 的 数据 区 域 的 起 始 位 置 变 更 至 虚拟 地 








址 为 0 WME 


91-94 执行 readi()， 将 程序 读 取 至 进程 的 数据 区 域 。 魔 术 数 字 
为 0407 时 读 取 代码 和 数据 ， 魔 术 数 字 为 0410 时 只 读 取 数据 。 偏 移 
量 020 表示 程序 文件 头 的 长 度 (€ 3-24) 。 









































“此 处 调用 estabur() 是 将 数据 段 的 虚拟 地 址 设 为 0 〈 物 理 地 址 并 没有 变 ) ， 原 因 是 之 后 调用 
readi() 的 参数 要 求 读 取 进 程 数据 区 到 虚拟 地 址 为 0 的 位 置 。 也 可 以 将 数据 段 物理 地 址 映射 
到 其 他 虚拟 地 址 上 ， 然 后 将 这 一 虚拟 地 址 作为 参数 传 给 readi( ) 。 不 过 用 0 更 为 方便 。 一 一 
审 校 者 注 
























































表 3-24 readi() 的 参数 











0407 时 为 代码 的 起 始 位 置 ，0410 时 为 数据 的 起 始 位 置 


0407 时 为 代码 和 数据 长 度 之 和 ，0410 时 为 代码 的 长 度 
oo 


96~100 ”执行 estabur() 最 终 确 定 用 户 空间 。 魔 术 数字 为 0410 











时 ， 通 过 estabur() 设 定 用 户 APR， 对 虚拟 地 址 空间 进行 如 下 变 
E: 将 代码 段 起 始 地 址 调整 至 虚拟 地 址 为 0 处 ， 数 据 区 域 起 始 地 址 
以 8KB 为 边界 对 齐 。 


103 ”从 这 里 开始 将 保存 于 缓冲 区 的 参数 转 存 至 栈 区 域 。 首 先 将 cp 
设 定 为 缓冲 区 的 数据 区 域 的 地 址 。 


104~105 ”计算 栈 指针 的 地 址 ， 并 设 定 用 户 进程 的 sp。 请 注意 ， 因 
为 栈 区 域 的 起 始 地 址 为 exffff， 换 算 成 int 型 将 为 负数 (图 3- 
14) 。 


长 度 ( 


I 

sp» ”参数 的 数量 |> 
参数 0 的 地 址 
| 
参数 n 的 地 址 
e 


参数 0 参数 1 


参数 n 





Oxffff 
图 3-14 计算 栈 指针 的 地 址 
106 将 na (参数 的 数量 ) 的 值 设 定 至 栈 指针 指 疝 的 用 户 空间 地 
址 。suword() 是 从 当前 模式 的 虚拟 地 址 空间 癌 前 一 模式 的 虚拟 地 
址 空间 复制 的 数据 。 
107 将 c 设 定 为 保存 参数 的 用 户 空间 地 址 。 
108-113 将 参数 及 地 址 存 入 栈 区 域 。 
114 将 参数 地 址 的 下 一 地 址 设置 为 -1。 


117 如 果 没 有 处 于 跟踪 状态 ( 详 见 第 6 章 ) ， 则 从 此 处 开始 设置 
SUID 和 SGID. 


118-122 如果 inode[] 中 代表 该 程序 文件 的 元 素 的 标志 位 ISUID 
已 被 设置 ， 且 当前 用 户 并 非 超级 用 户 〈u.u_uid 不 为 0) ， 则 将 该 
元 素 的 成 员 inode.i uid 设 定 至 u.u_uid。 


123-124 如果 inode[] 中 代表 该 程序 文件 的 元 素 的 标志 位 ISGID 
已 被 设置 ， 则 将 该 元 素 的 成 员 inode.i gid 设 定 至 u.u_gid。 


128 ”从 此 处 开始 对 信号 和 寄存 器 进行 初始 化 。 
129~131 如 果 u.u_signal[n] 的 值 为 偶数 则 清 0， 如 果 为 奇数 则 


保留 原 有 数据 。 如 果 在 此 之 前 依次 执行 了 fork 和 
exec, u.u signal[n] 的 值 则 为 从 父 进程 继承 的 数据 。 关 于 
u.u signal[n] 的 数据 含义 将 在 第 6 章 中 说 明 。 


132~134 将 用 户 进程 的 r0~r5、r7 的 值 清 0。 作 为 栈 指 针 的 r6 已 在 


第 105 行 设 定 完毕 。 


135-136 ”将 进行 浮动 小 数 点 运算 的 寄存 器 清 0。 此 处 理 与 PDP- 
11/40 无 关 。 


140 将 inode[] 中 代表 该 程序 执行 文件 的 元 素 的 参照 计数 需 减 
1e 





141 释放 用 于 参数 处 理 的 缓冲 区 。 


142~145 ”如 果 正 在 执行 的 exec() 的 进程 数 小 于 或 等 于 NEXEC， 
则 唤醒 其 他 等 待 进入 exec() 处 理 的 进程 。 同 时 递减 execnt， 表 
示 正 在 执行 的 exec() 的 进程 数 减 少 了 1 个 。 


estabur() 


estabur() 用 于 更 新 user 结构 体 中 的 用 户 APR 数据 user. u uisa[] 
和 user.u uisd[] C 3-25、 代 人 码 清单 3-34 ) ， 并 在 最 后 执行 
sureg()， 将 更 新 的 数据 反映 到 硬件 的 用 户 APR， 更 新 用 户 空间 。 


estabur() 接受 4 个 参数 。PPDA 和 数据 区 域 的 总 长 度 (nd) 与 栈 区 域 
的 长 度 (ns). 之 和 为 数据 段 的 长 度 。 由 于 PDP-11/40 对 代码 段 和 数据 段 
采用 相同 的 APR 进行 管理 (sep 为 0 ) ， 因 此 本 书 对 sep 为 1 时 的 处 
理 不 进行 说 明 。 


estabur() 对 与 用 户 PAR、PDR 相对 应 的 
user.u uisa[]. user.u uisd[] 进行 设 定 。 首 先 以 128x64 字 节 
(8KBO 为 单位 分 配 供 代 码 段 使 用 的 内 存 ， 余 数 作为 最 后 一 页 分 配给 代 
码 段 ， 并 将 PDR 设 定 为 只 读 。 然 后 以 128x64 字 节 为 单位 分 配 供 数据 区 
域 使 用 的 内 存 ， 在 数据 区 域 起 始 位 置 的 PAR 附加 与 user 结构 体 相 同 长 
度 的 内 存 ， 余 数 作为 最 后 一 页 分 配给 数据 区 域 ， 并 将 PDR 设 定 为 允许 
读 写 。 最 后 分 配 供 栈 使 用 的 页 。 由 于 栈 同 低位 地 址 方 同 扩展 ， 因 此 从 最 
高 位 的 页 开始 癌 低 位 进行 分 配 ， 余 数 作为 最 后 一 页 分 配给 栈 区 域 。 除 了 





将 PDR 设 定 为 允许 读 写 之 外 ， 还 设置 ED 标志 位 表示 癌 低 位 方 同 扩展 。 


对 代码 段 和 数据 段 的 PAR， 分 别 设 定 从 0 开始 的 相对 值 。 当 代码 段 、 数 
据 区 域 、 栈 区 域 的 长 度 均 为 192x64 字 节 时 ， 用 户 APR 的 状态 如 图 3-15 
所 示 。 


user.u. uisal] user.u. uisd[] 


64 RW ED 
127 RW 





图 3-15 ”由 estabur() 设 定 的 用 户 APR 的 示例 
K 3-25 estabur() 的 参数 











代码 清单 3-34 estabur() (ken/main.c) 





stabur(nt, nd, ns, sep) 


e 
{ 


register a, *ap, *dp; 





1 
2 
3 
4 
5 /* 正当 性 检查 */ 
6 
7 
8 
9 


if(sep) { 
if(cputype -- 40) 
goto err; 
if(nseg(nt) > 8 || nseg(nd)«nseg(ns) > 8) 

10 goto err; 
11 ) else 
12 if(nseg(nt)«nseg(nd)«nseg(ns) > 8) 
13 goto err; 
14 if(nt«ndens-USIZE > maxmem) 
15 goto err; 
16 
17 /* 分 配 代码 段 */ 
18 a = ð; 
19 ap = &u.u uisa[0]; 
20 dp = &u.u uisd[0]; 
21 while(nt >= 128) ( 
22 *dp++ = (127««8) | RO; 
23 *aprt = a; 
24 a =+ 128; 
25 nt =- 128; 
26 
27 if(nt) { 
28 *dp++ = ((nt-1)««8) | RO; 
29 *aprt = a; 
30 
31 if(sep) 
32 while(ap < &u.u_uisa[8]) { 
33 *ap++ = 0; 
34 *dp++ = 0; 
35 } 
36 
37 /* 分 配 数据 区 域 */ 
38 a = USIZE 
39 while(nd >= 128) ( 
40 *dp++ = (127««8) | RW; 
41 *aprt = a; 
42 a =+ 128; 
43 nd =- 128; 
44 } 


45 if(nd) { 


46 *dp++ = ((nd-1)««8) | RW; 


47 *aprt = a; 

48 a =+ nd; 

49 } 

50 while(ap < &u.u_uisa[8]) { 
51 *dp++ = 0; 

52 *ap++ = 0; 

53 } 

54 if(sep) 

55 while(ap < &u.u_uisa[16]) { 
56 *dp++ = 0; 

57 *ap++ = 0; 

58 } 

59 

60 /* 分 配 栈 区 域 */ 

61 a =+ ns; 

62 while(ns >= 128) { 

63 a =- 128; 

64 ns =- 128; 

65 *--dp = (127««8) | RW; 
66 *--ap = a; 

67 } 

68 if(ns) ( 

69 *--dp = ((128-ns)««8) | RW | ED; 
70 *--ap - a-128; 

71 } 

72 if(!sep) { 

73 ap = &u.u uisa[0]; 

74 dp = &u.u uisa[8]; 

75 while(ap « &u.u uisa[8]) 
76 *dpr- = *ap++; 

77 ap = &u.u uisd[0]; 

78 dp = &u.u uisd[8]; 

79 while(ap « &u.u uisd[8]) 
80 *dpr- = *ap++; 

81 } 

82 sureg(); 

83 return(0); 

84 

85 err: 

86 u.u error - ENOMEM; 

87 return(-1); 

88 ) 





12-13 nseg() 是 将 以 64 字 市 为 单位 的 块 数 转换 为 页 数 的 函数 。 
如 有 果 总 页 数 大 于 8 则 出 错 。 


14-15 ”如 果 需 要 的 块 数 ( 以 64 字 节 为 单位 ) 大 于 能 够 使 用 的 内 存 
容量 上 限 则 出 错 。maxmem 表示 能 够 使 用 的 物理 内 存 容 量 上 限 ， 在 
系统 启动 时 设 定 。 


18-30 ”对 代码 段 使 用 的 user 结构 体 中 的 APR 进行 设 定 。 


38~53 “对 数据 区 域 使 用 的 user 结构 体 中 的 APR 进行 设 定 。 因 为 
数据 段 起 始 位 置 的 16x64 字 节 被 分 配给 PPDA， 因 此 需要 将 PAR 
与 USIZE (16) 相 加 。 当 数据 区 域 分 配 完毕 时 ， 到 APR6 为 止 的 区 
域 被 清 o. 


61~71 分 配 栈 区 域 使 用 的 页 。 


82 执行 sureg()， 将 user 结构 体 中 的 APR 反映 到 硬件 的 用 户 
APR， 以 更 新 用 户 空 间 。 


83 estabur() 执行 成 功 时 返回 0。 


sureg() 


sureg() 将 执行 进程 的 user 结构 体 中 保存 的 APR 数据 反映 到 硬件 的 
用 户 APR， 以 更 新 用 户 空间 (代码 清单 3-35 . sureg() 除了 在 
estabur() 中 更 新 user 结构 体 的 APR 数据 时 被 调用 外 ， 在 切换 执行 
进程 时 也 会 被 调用 。 


因为 user 结构 体 中 保存 的 APR 数据 采用 相对 地 址 ， 在 转 存 至 硬件 的 用 
户 APR 时 ， 需 要 根据 分 配给 进程 的 内 存 区 域 的 物理 地 址 进行 补正 。 代 
码 段 需要 将 text.x_caddr (参照 第 4 章 ) 、 数 据 段 需要 将 
proc.p_addr 分 别 与 补正 值 相 加 (图 3-16 ) 。 





user.u uisa[]. user.u uisd[] 
«— text.x caddr 
d LC wt $ v I 代码 段 
代码 1 





eise pic iD d gr «— proc.p. addr 


物理 内 存 


图 3-16 sureg() 


代码 清单 3-35 sureg() (ken/main.c) 





1 

2 

3 register *up, *rp, a; 
4 

5 /* 设 定 PAR */ 

6 a - u.u procp->p addr; 
7 up = &u.u uisa[16]; 

8 rp = &UISA-?r[16]; 

9 if(cputype -- 40) ( 
10 up =- 8; 
11 rp =- 8; 
12 } 
13 
14 while(rp > &UISA-»r[0]) 
15 *--pp = *--up + a; 
16 if((up=u.u_procp->p_textp) != NULL) 
17 a =- up->x_caddr; 
18 
19 /* PDR */ 
20 up = &u.u uisd[16]; 
21 rp = &UISD-?r[16]; 


22 if(cputype -- 40) ( 


23 up =- 8; 

24 rp =- 8; 

25 } 

26 while(rp > &UISD-»r[0]) { 

27 *--pp = *--up; 

28 if((*rp & WO) == 0) 

29 rp[(UISA-UISD)/2] =- a; 
30 

31 } 





6-15 根据 数据 段 的 物理 地 址 对 user 结构 体 的 APR 数据 进行 补 
正 ， 并 用 补正 后 的 值 更 新 用 户 PAR。UISA 为 用 户 PARO 的 地 址 
(代码 清单 3-36) . 


代码 清单 3-36 UISA (seg.h) 


1 #define UISA 0177640 





16-17 如果 执行 进程 使 用 代码 段 ， 则 根据 代码 段 的 物理 地 址 确定 
补正 值 ， 并 将 其 赋予 a。 


20-30 ”使 用 user 结构 体 的 APR 数据 更 新 PDR。 在 设 定 读 取 专用 
代码 段 的 PDR 时 ， 将 对 应 的 PAR 寄存 器 的 值 与 第 17 行 设 定 的 补 
正 值 相 加 。UDSA 为 用 户 PDR0 的 地 址 (代码 清单 3-37) 。 


代码 清单 3-37 UDSA (seg.h) 


1 #define UDSA 0177660 


expand() 


expand() 用 来 扩展 或 缩小 数据 段 〈 表 3-26， 代 码 清单 3-38 ) 。 缩 小 数 
据 段 时 调用 mfree() 释放 不 需要 的 内 存 。 扩 展 数据 段 时 调用 malloc() 
重新 分 配 与 数据 段 全 体 长 度 相 同 的 内 存 ， 并 将 其 指向 用 户 空间 (图 3-17 
) 。 如 果 出 现 内 存 不 足 的 情况 ， 则 将 进程 从 内 存 换 出 至 交换 空间 ， 直 到 
可 以 分 配 足 够 的 内 存 (图 3-18 ) 。expand() 接受 为 数据 段 指 定 的 新 的 
长 度 作 为 参数 。 








缩小 
物理 内 存 
proc.p_add > proc.p_add 
调用 mfree() 
) 调用 mfree() 释放 内 存 
释放 内 存 
proc.p_add 
调用 malloc) 
分 配 内 存 





在 此 之 后 调用 sureg() 更 新 用 户 APR 并 更 新 用 户 空 间 


图 3-17 expand() 





调用 mfree() 






proc.p. addr —» 





m 
ee 
- 


图 3-18 暂时 将 数据 换 出 内 存 


表 3-26 expand() 的 参数 

















newsize 





xpand(newsize) 


e 
{ 


int i, n; 
register *p, a1, a2; 


p = u.u procp; 
n p-»p size; 
p-»p size = newsize; 
a1 = p-»p addr; 
if(n >= newsize) { 
mfree(coremap, n-newsize, al-rnewsize); 
return; 
} 
savu(u.u rsav); 
a2 - malloc(coremap, newsize); 
if(a2 -- NULL) ( 
savu(u.u ssav); 
xswap(p, 1, n); 
p-»p flag =| SSWAP; 
swtch(); 
/* 从 退出 expand() 的 地 方 继续 运行 





j 

p-»p addr = a2; 

for(i-0; i«n; i++) 
copyseg(al+i, a2++); 

mfree(coremap, n, a1); 

retu(p-»p addr); 


sureg(); 





8 更 新 表示 数据 段 长 度 的 proc.p_size。 


10-13 XE AREE, n mfree() 释放 不 再 需要 的 内 
存 并 返回 。 


14~15 ”如 果 需 要 扩展 ， 则 调用 malloc() 分 配 供 数据 段 使 用 的 新 
内 存 。 因 为 在 第 27 行将 执行 retu()， 所 以 在 此 处 执行 savu() 以 
提前 保存 r5 和 r6。 


16~22 如果 出 现 内 存 不 足 的 情况 ， 则 将 进程 从 内 存 换 出 至 交换 空 
间 。 当 进程 被 换 入 内 存 之 后 再 次 党 试 分 配 内 存 ， 然 后 执行 swtch() 
切换 执行 进程 。 当 该 进程 再 次 成 为 执行 进程 时 ， 从 退出 expand() 
的 地 方 继续 运行 。 

23-26 ”将 数据 段 的 内 容 复 制 到 新 分 配 的 内 存 区 域 。 将 


proc.p_addr 设置 为 新 分 配 的 内 存 区 域 的 地 址 ， 并 调用 mfree() 
释放 原 有 的 数据 段 。 


27-28 ”因为 数据 段 的 地 址 已 经 更 改 ， 所 以 执行 retu() 和 
sureg() 以 更 新 用 户 空 间 。 








3.5 ”进程 的 终止 


当 程序 执行 完毕 之 后 ， 该 进程 的 运行 将 被 终止 ， 被 其 占用 的 资源 也 会 释 
放 。 进 程 的 终止 处 理 包括 一 下 两 个 步骤 。 


1. 用户 程序 执行 系统 调用 exit， 使 进程 进入 僵尸 状态 (SZOMB) 。 将 
user 结构 体 换 出 至 交换 空间 ， 同 时 释放 被 其 占用 的 内 存 。 


2. 父 进程 通过 执行 系统 调用 wait 取得 子 进程 的 完结 状态 ， 并 负责 清理 
处 于 僵尸 状态 的 子 进程 。 


系统 调用 exit 

系统 调用 exit 的 主要 功能 如 下 所 示 。 

。 关闭 打开 的 文件 

。 将 当前 目录 的 参照 计数 器 减 1 

。 释放 代码 段 

。 将 user 结构 体 复 制 到 交换 空间 

。 释放 数据 段 

e 使 进程 进入 僵尸 状态 CSZOMB) 

e 唤醒 父 进 程 和 init 进程 

e 如 果 当 前 进程 存在 子 进 程 ， 则 将 其 设置 为 init 进程 的 子 进程 
被 复制 到 交换 空间 的 user 结构 体 将 在 父 进程 清理 子 进 程 时 投入 使 用 。 
如 果 由 于 程序 自身 的 错误 ， 使 得 进程 在 进入 僵尸 状态 时 没有 正确 清理 属 
于 自己 的 的 子 进程 ， 那 么 这 些 子 进程 将 处 于 无 人 管理 的 状态 。 因 此 ， 当 


被 终止 的 进程 存在 子 进程 时 ， 将 委托 init 进程 (proc[1]〉 对 子 进程 
进行 清理 。init 进程 在 系统 启动 时 被 创建 ， 该 进程 负责 清理 终止 的 进 





程 、 初 始 化 终端 等 工作 《图 3-19 ) 。 


将 失去 归属 的 子 进程 设 定 为 如 果 处 于 僵尸 状态 
init 进程 的 子 进程 则 清理 





图 3-19 系统 调用 exit 


在 处 理 的 最 后 阶段 执行 swtch() 切换 执行 进程 。 期 待 父 进程 对 当前 进 
程 ，init 进程 对 原本 属于 目 己 的 子 进程 进行 清理 。 因 为 已 进入 僵尸 状 
态 ， 执 行 系统 调用 exit 的 进程 不 会 再 次 成 为 执行 进程 。 


如 果 用 户 程 序 执行 了 系统 调用 exit， 内 核 的 rexit() 将 被 执行 〈 表 3- 
27， 代 码 清单 3-39 ) . rexit() 会 调用 exit() 终止 进程 运行 (代码 
清单 3-40 ) 。 系 统 调用 exit 的 参数 为 进程 的 完结 状态 。 完 结 状态 保存 
fr user.u arg[0] 中 。 当 父 进程 进行 清理 处 理 时 ，user.u_arg[8] 以 
高 位 8 比特 为 完结 状态 、 低 位 8 比特 为 错误 信息 的 格式 传递 给 父 进程 。 


K 3-27 系统 调用 exit 的 参数 

















参数 








1 
2 
3 
4 u.u arg[0] = u.u are[Re] «« 8; 
5 exit(); 

6 


| | 


代码 清单 3-40 exit() (ken/sys1.c) 


10 





register int *q, a; 
register struct proc *p; 


u.u procp-»p flag =& -STRC; 
for(q = &u.u signal[0]; q « &u.u signal[NSIG];) 
*q++ = 1; 
for(q = &u.u ofile[0]; q < &u.u ofile[NOFILE]; q++) 
if(a = *q) 1 
*q = NULL; 
closef(a); 
} 
iput(u.u cdir); 
xfree(); 
a - malloc(swapmap, 1); 
if(a == NULL) 
panic("out of swap"); 
p = getblk(swapdev, a); 
bcopy(&u, p-»b addr, 256); 
bwrite(p); 
q = u.u procp; 
mfree(coremap, q-»p size, q-»p addr); 
q-»p addr = a; 
q-»p stat - SZOMB; 


27 loop: 


for(p = &proc[0]; p < &proc[NPROC]; p++) 
if(q-»p ppid == p-»p pid) ( 
wakeup(&proc[1]); 
wakeup(p); 
for(p = &proc[0]; p < &proc[NPROC]; p++) 
if(q-»p pid -- p-»p ppid) ( 
p-»p ppid = 1; 
if (p-»p stat -- SSTOP) 
setrun(p); 


swtch(); 
} 
q->p_ppid = 1; 
goto loop; 


| OE 
6 如果 当前 处 于 跟踪 处 理 中 ， 则 将 跟踪 标志 位 设置 为 无 效 。 
7-8 ”为 了 忽略 所 有 信号 ， 将 所 有 u.u signal[n] 设置 为 1。 
9~13 ”关闭 所 有 由 当前 进程 打开 的 文件 。 
14 递减 当前 目录 的 参照 计数 器 。 
15 释放 代码 段 。 
16-18 ”分 配 交 换 空 间 。 
19~21 执行 getblk()， 取 得 交换 磁盘 (用 作 交 换 空 间 的 块 设备 ) 
的 块 设备 绥 冲 区 。 然 后 执行 bcopy() 将 包含 user 结构 体 在 内 的 
位 于 数据 段 头 部 的 512 字 节 复制 到 上 述 缓冲 区 ， 再 执行 bwrite() 
将 缓冲 区 内 的 数据 写 入 交换 空间 。 


22~25 释放 内 存 中 的 数据 段 。 然 后 把 proc.p_addr 设置 为 交换 磁 
盘 中 的 块 编 号 ， 再 将 proc.p_stat 设置 为 SZOMB。 


28-39 ”唤醒 父 进程 和 init 进程 。 如 果 存 在 尚未 清理 的 子 进程 ， 
则 将 其 父 进 程 设 置 为 init 进程 。 另 外 ， 如 果 该 子 进程 处 于 SSTOP 
状态 ， 则 解除 该 状态 并 将 其 设置 为 可 执行 状态 。 最 后 执行 swtch() 
切换 执行 进程 。 因 为 proc.p_stat 为 SZOMB， 所 以 当前 进程 不 会 
再 次 执行 。 


40-41 ”如 果 由 于 某 种 原因 当前 进程 中 才 不 存在 父 进 程 ， 则 将 其 父 
进程 设置 为 init 进程 ， 并 返回 第 28 行 再 次 执行 。 

系统 调用 wait 

如 果 用 户 程序 执行 了 系统 调用 wait， 当 前 进程 的 运行 将 被 中 断 ， 控 制 
权 会 交 给 其 他 进程 。wait 等 待 子 进程 运行 结束 ， 如 果 不 存 在 子 进程 则 
不 做 任何 处 理 。 

系统 调用 wait 主要 有 下 述 3 个 作用 。 




















e 通过 sleep() 中 断 目 身 的 运行 
。 清理 处 于 僵尸 状态 的 子 进 程 


e 寻找 处 于 SSTOP 状态 (参见 第 6 章 ) 的 子 进程 ， 并 解除 该 状态 
wait() 是 系统 调用 wait 的 处 理 函 数 《〈 代 码 清单 3-41 ) 。 


代码 清单 3-41 wait() (ken/sys1.c) 





1 

2 

3 register f, *bp; 

4 register struct proc *p; 

5 

6 f = 0; 

7 loop: 

8 for(p = &proc[0]; p < &proc[NPROC]; p++) 
9 if(p-»p ppid == u.u procp-»p pid) ( 
10 fj 
11 if(p-»p stat -- SZOMB) ( 
12 u.u are[Re] = p-»p pid; 
13 bp = bread(swapdev, f-p-»p addr); 
14 mfree(swapmap, 1, f); 
15 p-»p stat - NULL; 
16 p-»p pid = 6€; 
17 p-»p ppid = 6; 
18 p-»p sig = 6; 
19 p-»p ttyp = €; 
20 p-»p flag = 6€; 
21 p = bp-»b addr; 
22 u.u cstime[0] =+ p-»u cstime[0]; 
23 dpadd(u.u cstime, p-»u cstime[1]); 
24 dpadd(u.u cstime, p-»u stime); 
25 u.u cutime[0] =+ p-»u cutime[0]; 
26 dpadd(u.u cutime, p-»u cutime[1]); 
27 dpadd(u.u cutime, p-»u utime); 
28 u.u are[R1] = p-»u arg[?]; 
29 brelse(bp); 

30 return; 

31 } 

32 if(p->p_stat == SSTOP) { 

33 if((p->p_flag&SWTED) == 0) { 

34 p->p_flag =| SWTED; 


35 u.u are[Re] = p-»p pid; 


36 u.u are[R1] = (p-»p sig««8) | 0177; 
37 return; 

38 } 

39 p->p_flag =& ~(STRC|SWTED); 

40 setrun(p); 

41 ) 


j 
43 if(f) ( 
44 sleep(u.u procp, PWAIT); 
45 goto loop; 


47 u.u error - ECHILD; 








6 将 表示 子 进程 数量 的 f 清 0。 
8-9 遍历 proc[] 寻找 子 进程 。 
10 递增 子 进程 的 数量 。 





11-31 ”如 果子 进程 处 于 僵尸 状态 则 进行 下 列 处 理 。 


。 将 用 户 进程 的 re 设置 为 子 进程 的 proc.p_pid， 并 将 其 作为 
系统 调用 wait 的 返回 值 。 用 户 程序 可 通过 该 值 确认 执行 完毕 


的 子 进 程 。 
e 从 换 出 至 交换 空间 的 user 结构 体 中 获得 子 进程 占用 CPU 的 时 
间 。 


。 清除 proc 结构 体 的 各 个 成 员 。 


e 将 用 户 进程 的 n1 设置 为 子 进程 的 user.u_arg[8]。 用 户 程序 
通过 该 值 可 了 解 子 进 程 运行 结束 时 的 状态 。 


最 后 执行 return。 依 次 清理 处 于 僵尸 状态 的 子 进 程 。 如 宋 需 要 清 
理 多 个 子 进程 ， 需 要 父 进程 再 次 执行 系统 调用 wait. 


32~41 与 跟踪 相关 的 内 容 会 在 第 6 章 中 介绍 。 


43-46 如果 发 现 既 不 处 于 僵尸 状态 ， 也 不 处 于 SSTOP 状态 的 子 进 











程 ， 则 进入 睡眠 状态 ， 等 待 该 子 进程 处 理 完毕 。 被 唤醒 后 返回 
loop 再 次 进行 检查 。 


47 ”如果 没有 发 现 子 进程 则 认为 出 错 。 








3.6 ”数据 区 域 的 扩展 


系统 调用 break 


系统 调用 break 用 来 扩展 或 缩小 数据 段 中 数据 区 域 的 长 度 。 供 用 户 程 
序 调用 的 C 语言 库 函 数 malloc() 等 使 用 break 实现 对 堆 区 域 的 扩展 
等 操作 。 位 于 虚拟 地 址 空间 的 数据 区 域 后 部 的 地 址 被 称 为 break。 系 统 
调用 break 的 用 途 可 以 看 做 是 调整 break 的 位 置 (图 3-20 ) 。 





虚拟 地 址 空间 
0 
A 
i 
«— break 
| 
v 
Oxffff 





图 3-20 系统 调用 break 


数据 区 域 的 扩展 和 缩小 通过 expand() 进行 。 伴 随 数据 区 域 的 扩展 和 缩 
小 ， 栈 区 域 的 位 置 也 会 发 生变 化 。 








sbreak() 是 系统 调用 break 的 处 理 函 数 〈 表 3-28， 代 码 清单 3-42 
J^ 


K 3-28 系统 调用 sbreak 的 参数 











u.u arg[0] 新 的 break 的 虚拟 地 址 〈 字 节 单 位 ) 














代码 清单 3-42 sbreak() (ken/sysl.c) 





1 

2 

3 register a, n, d; 

4 int i; 

5 

6 n = (((u.u arg[0]463)»»6) & 01777); 
7 if(lu.u sep) 

8 n -- nseg(u.u tsize) * 128; 

9 if(n « 0) 

10 n= ð; 

11 d = n - u.u dsize; 

12 n =+ USIZE-*u.u ssize; 

13 if(estabur(u.u tsize, u.u dsize4d, u.u ssize, u.u sep)) 
14 return; 

15 u.u dsize =+ d; 
16 if(d » 0) 
17 goto bigger; 
18 a = u.u procp-»p addr + n - u.u ssize; 
19 ien; 
20 n = u.u ssize; 
21 while(n--) { 
22 copyseg(a-d, a); 
23 a++; 
24 } 
25 expand(i); 
26 return; 
27 
28 bigger: 
29 expand(n); 

30 a = u.u_procp->p_addr + n; 


31 n = u.u ssize; 


32 while(n--) ( 
Ra 


33 ; 
34 copyseg(a-d, a); 
35 

36 while(d--) 

37 clearseg(--a); 
38 ) 





6-12 将 通过 参数 获得 的 以 字 市 为 单位 的 地 址 变 成 以 64 字 市 为 单位 
的 形式 ， 然 后 减 去 按 页 (以 8KB 为 单位 ) 划分 的 代码 段 的 长 度 ， 





得 到 新 的 数据 区 域 的 长 度 。d 用 于 保存 当前 数据 区 域 和 新 的 数据 区 
域 的 长 度 差 。n 用 于 保存 新 的 数据 段 全 体 的 长 度 。 


13~14 更 新 用 户 APR， 以 更 新 用 户 空 间 。 
15 更 新 通过 user 结构 体 管理 的 数据 区 域 长 度 。 
16-17 如果 是 扩展 数据 区 域 ， 则 跳 转 到 bigger. 


18-26 如果 是 缩小 数据 区 域 ， 则 将 栈 区 域 问 物理 地 址 的 低位 地 址 
方向 移动 ， 并 执行 expand() 删除 剩余 的 部 分 。 


29-37 ”如 果 是 扩展 数据 区 域 ， 则 将 栈 区 域 向 物理 地 址 的 高 位 地 址 
方 同 移动 ， 然 后 执行 expand() 扩展 数据 段 。 














3.7 管理 内 存 和 交换 空间 

进程 通过 虚拟 地 址 访问 分 配给 自身 的 物理 内 存 。 内 核 需 要 为 各 进程 分 配 
物理 地 址 ， 因 此 必须 对 物理 内 存 中 已 被 使 用 和 尚未 使 用 的 区 域 进行 管 
理 。 出 于 同样 的 理由 ， 内 核对 交换 空间 也 需要 进行 管理 。 

本 节 对 内 核 物理 内 存 和 交换 空间 中 未 使 用 区 域 的 管理 方法 进行 说 明 。 
map 结构 体 

内 核 利 用 map 结构 体 〈 代 码 清单 3-43， 表 3-29 ) 对 物理 内 存 和 交换 空 
n CEU map 结构 体 的 成 员 包含 未 使 用 区 域 的 地 址 和 


代码 清单 3-43 map (ken/malloc.c) 





truct map 


char *m size; 
char *m addr; 





coremap[] 用 来 管理 物理 内 存 ，swapmap[ ] 用 来 管理 交换 空间 (代码 
清单 3-44， 表 3-30 ) 。 数 组 元 素 的 排列 顺序 与 地 址 顺序 相同 〈 图 3-21 
) 。 对 物理 内 存 和 交换 空间 的 未 使 用 区 域 采用 同样 的 算法 进行 管理 。 





代码 清单 3-44  coremap 和 swapmap (system.h) 


1 int coremap [CMAPSIZ]; 
2 int swapmap [SMAPSIZ]; 


请 注意 ，coremap[] 和 suapmap[ ] 分 别 以 64 字 节 和 512 字 节 为 单位 管 
理 未 使 用 的 区 域 。 


K 3-30 coremap[] 和 swapmapl] 
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图 3-21 管理 未 使 用 区 域 


coremap[] 和 swapmap[] 于 系统 启动 时 在 main() 中 被 初始 化 ( 详 见 
第 14 章 ) 。 


获取 未 使 用 区 域 
在 获取 物理 内 存 和 交换 空间 的 未 使 用 区 域 时 采用 了 First Fit 算法 ， 即 从 


起 始 位 置 开 始 遇 历数 组 ， 寻 找 满足 长 度 要 求 并 排 在 最 前 面 的 元 素 〈 图 3- 
22: 








AE. 15 
未 命 命中 


地 址 ，20 地 址 ，50 地 址 ，100 
KE. 10 KE. 30 KÆ. 20 
图 3-22 First Fit 


以 找到 的 未 使 用 区 域 的 起 始 位 置 为 起 点 ， 分 配 所 需 长 度 的 区 域 。 然 后 增 
加 该 数组 元 素 的 地 址 值 ， 并 递减 其 长 度 值 ， 使 增加 和 减少 的 长 度 等 于 新 
分 配 区 域 的 长 度 (图 3-23 ) 。 

KE. 15 


未 命 
地 址 ，20 
TUE. 10 

Hb. 20 
KÆ. 10 
图 3-23 命中 


如 果 元 素 的 长 度 和 所 需 长 度 相同 则 删除 该 元 素 ， 并 将 所 有 余下 的 元 素 问 
前 移动 1 个 位 置 (图 3-24 ) 。 

























地 址 ，50 
KE: 30 


地 址 
长 度 


: 100 
: 20 






ttt: 100 
KE. 20 




























命中 
Hetk: 20 地 址 ，50 Hb. 100 
TUE. 10 KÆ. 30 KE. 20 
Hbu. 20 Hb. 100 
JH. 10 KE. 20 






图 3-24 问 前 方 移动 


在 数组 有 效 元 素 的 尾部 ， 有 一 个 长 度 为 0 的 元 素 。 当 通过 循环 依次 处 理 
数组 时 ， 如 果 遇 见 该 元 素 ， 循 环 将 终止 。 这 个 长 度 为 0 的 元 素 被 称 
为 “哨兵 ”或 “看 守 ”( 图 3-25 ) 。 








地 址 ，20 地 址 ，50 
KÆ: 10 KE. 30 





图 3-25 哨兵 


malloc() 是 取得 物理 内 存 和 交换 空间 的 函数 ( 表 3-31， 代 码 清单 3-45 
) 。 该 阔 数 返回 所 取得 区 域 的 地 址 。 取 得 失败 时 返回 0。 


表 3-31 malloc() 的 参数 


a iun i — 





代码 清单 3-45 malloc() (ken/malloc.c) 


1 malloc(mp, size) 
2 struct map *mp; 


register int a; 
register struct map *bp; 


for (bp = mp; bp-»m size; bp++) ( 
if (bp-»m size »- size) ( 
a = bp-»m addr; 
bp-»m addr =+ size; 


if ((bp-»m size -- size) -- 0) 
do { 
bp++; 
(bp-1)->m addr = bp-»m addr; 
) while ((bp-1)-»m size = bp-»m size); 
return(a); 


} 


return(0); 





释放 区 域 


mfree() 是 用 来 释放 物理 内 存 和 交换 空间 的 函数 〈 表 3-32， 代 码 清单 
3-46) 。 从 coremap[]. swapmap[] 的 起 始 位 置 开 始 遍 历数 组 ， 直 到 
到 达 指 定 地 址 的 要 素 ， 然 后 将 其 返还 至 数组 中 (图 3-26 ) 。 如 果 释 放 
对 象 区 域 的 地 址 与 插入 位 置 前 后 区 域 的 地 址 相连 ， 则 合并 相关 区 域 ( 图 
3-27) . 


Hb. 40 
IH. 5 













Hb. 20 
JE. 10 


Hb. 100 
1E. 20 


Hb. 50 
KE: 30 


地 址 : 50 
长 度 : 30 


地 址 : 40 
长 度 . 5 


Hbk: 20 
AXE. 10 






图 3-26 释放 
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tbtt: 100 
KE. 20 


地 址 : 20 
长 度 : 10 











地 址 ，50 
XE. 30 


地 址 ，40 
KE: 40 














地 址 : 100 
AXE. 20 






地 址 : 20 
IKE. 10 


图 3-27 区 域 的 合并 
K 3-32 mfree() 的 参数 


含义 
T 2 We 


释放 区 域 的 长 度 
2M 释放 区 域 的 地 址 


代码 清单 3-46 mfree() (ken/malloc.c) 








1 mfree(mp, size, aa) 
2 struct map *mp; 


3 { 

4 register struct map *bp; 
5 register int t; 

6 register int a; 

7 

8 a = aa; 


for (bp = mp; bp-»m addr«-a && bp-»m size!-0; bp++); 
if (bp»mp && (bp-1)-»m addre-(bp-1)-»m size == a) ( 
(bp-1)-»m size =+ size; 
if (atsize == bp-»m addr) ( 
(bp-1)-»m size =+ bp-»m size; 
while (bp-»m size) ( 
bp++; 
(bp-1)->m addr = bp->m addr; 
(bp-1)->m size = bp->m size; 


} 
} 
} else { 
if (atsize == bp-»m addr && bp-»m size) { 
bp-»m addr -- size; 


bp-»m size =+ size; 
) else if (size) do ( 
t = bp-»m addr; 
bp-»m addr = a; 
a-t; 
t = bp-»m size; 
bp-»m size - size; 
bp++; 
) while (size = t); 





3.8 ”小 结 
系统 调用 fork 用 来 创建 进程 。 子 程序 可 被 视 作 父 进程 的 抄 贝 


系统 调用 wait 使 父 进程 在 等 待 子 进程 执行 结束 时 进入 睡眠 状态 ， 
并 在 子 进程 执行 结束 后 对 其 进行 清理 


208 exec 将 程序 执行 文件 读 取 到 内 存 ， 并 构筑 程序 的 执行 环 
Bi 











系统 调用 exit 使 进程 进入 僵尸 状态 。 进 入 该 状态 的 进程 由 其 父 进 
程 清理 


init 进程 负责 对 失去 父 进程 、 处 于 无 所 属 状态 的 进程 进行 清理 


执行 进程 中 断后 ， 控 制 权 将 切换 到 具有 更 高 执行 优先 级 ， 并 处 于 可 
执行 状态 的 进程 


通过 保存 和 恢复 上 5、r6、 用 户 APR、 内 核 PAR6 的 值 实现 上 下 文 切 
换 








利用 sleep() 和 wakeup() 实现 对 资源 的 等 每 处 理 


利用 map 结构 体 ， 并 采用 相同 的 算法 管理 物理 内 存 和 交换 空间 的 未 
使 用 区 域 


采用 First Fit 算法 获取 未 使 用 区 域 的 处 理 
e 在 启动 时 对 coremap[] 和 swapmap[] 进行 初始 化 





第 4 半 ”交换 处 理 


41 什么 是 交换 处 理 


执行 程序 时 必须 将 代码 和 数据 读 入 内 存 。 内 存 的 处 理 速度 很 快 ， 但 容量 
受 限 。 随 着 进程 数量 的 增多 ， 内 存 将 无 法 容纳 所 有 程序 的 代码 和 数据 。 


因此 ， 内 核 通 过 定期 执行 交换 处 理 ， 将 处 于 休眠 状态 或 执行 优先 级 较 低 
的 进程 从 内 存 移 至 处 理 速度 较 慢 但 容量 较 大 的 磁盘 等 交换 空间 〈 换 出 ， 
swap out) ， 当 这 些 进程 成 为 可 执行 状态 时 ， 再 将 其 移 回 内 存 〈 换 入 ， 
swap in) 。 通 过 交换 处 理 , 只 有 马上 需要 执行 的 进程 才 会 存在 于 内 存 中 ， 
因此 可 以 更 有 效 地 利用 有 限 的 内 存 资源 。 同 时 也 可 以 避免 内 存 容量 的 
限制 ,以 并 列 方式 执行 更 多 的 进程 (图 4-1 ) 。 


通过 将 重要 级 别 较 低 的 进程 














换 到 交换 空间 ， 并 将 必要 的 ( Spei 
进程 换 入 内 存 ， 可 以 更 有 效 
地 使 用 内 存 
内 存 
换 出 


容量 小 、 高 速 容量 大 、 低 速 
图 4-1 交换 处 理 
代码 段 和 数据 段 


对 进程 进行 换 入 处 理 时 ， 当 代码 段 读 入 到 内 存 后 ， 位 于 交换 空间 内 的 代 
码 段 仍 将 保留 。 当 进程 执行 结束 或 被 换 出 内 存 时 ， 如 果 代码 段 不 再 个 内 
存 中 的 任何 进程 所 参照 ， 则 会 从 内 存 中 被 释放 。 


与 此 相反 ， 对 数据 段 进行 换 入 、 换 出 处 理 时 ,作为 处 理 对 象 的 数据 将 从 
原 有 设备 上 被 释放 (图 4-2 ) 。 


对 代码 段 而 言 …… 换 入 处 理 从 交换 空间 向 内 存 
复制 数据 





不 再 被 内 存 中 的 任何 
进程 所 参照 时 从 内 存 
中 被 释放 





内 存 交换 空间 
对 数据 段 而 言 …… 
换 入 、 换 出 处 理 将 伴随 数据 的 移动 


图 4-2 代码 段 和 数据 段 


代码 段 与 数据 段 的 不 同 之 处 在 于 ， 代 码 段 数据 是 只 读 的 ， 这 使 交换 空间 
和 内 存 中 的 数据 总 保持 一 致 ， 因 此 系统 对 其 进行 了 上 述 优化 。 


sched() 


sched() 也 被 称 作 swapper 函数 ， 用 来 寻找 作为 交换 处 理 对 象 的 进程 
(代码 清单 4-20 ， 由 系统 启动 时 生成 的 进程 proc[8] 定期 调 

a swtch() 也 由 proc[0] 调用 ， 因 此 proc[0e] 被 称 为 调度 进程 或 调 
EE o 


sched() 从 proc[] 中 寻找 满足 下 述 条 件 的 进程 作为 换 入 处 理 的 对 象 。 
。 位 于 交换 空间 的 时 间 最 长 

。 处 于 可 执行 状态 
oa 


e 位 于 内 存 中 
e 处 于 SWAIT 或 SSTOP 状态 


人 
o 





e. AATRE 
e 处 于 SRUN 或 SSLEEP 状态 


但 是 在 这 种 情况 下 ， 作 为 换 入 对 象 的 进程 距 上 次 被 换 出 的 时 间 必 须 大 于 
或 等 于 3 秒 ， 而 作为 换 出 对 象 的 进程 距 上 次 被 换 入 的 时 间 必 须 大 于 或 等 
on COH pie DIE 
处 理 的 情况 。 


上 述 处 理 将 反复 执行 ， 直 到 不 再 存在 作为 换 入 或 换 出 对 象 的 进程 〈 图 4- 
3) 。 如 果 处 理 结 束 时 不 再 存在 可 作为 换 入 对 象 的 进程 ，runout 标志 
变量 会 被 设置 为 大 于 0 的 值 。 如 果 不 再 存在 可 作为 换 出 对 象 的 进 

程 ，runin 标志 变量 会 被 设置 为 大 于 0 的 值 〈 代 码 清单 4-1， 表 4-1 

Jg 


procl] 交换 空间 







CD 在 位 于 交换 空间 的 进程 中 寻找 处 
于 可 执行 状态 、 被 移出 内 存 时 间 
最 长 的 进程 





2) RERI THAE A E 

空间 不 足 ， 就 从 满足 条 件 的 

进程 中 选择 1 个 将 其 换 出 内 
存 ， 并 返回 到 人) 









对 象 

1. 处 于 SWAIT 或 SSTOP 状态 

Z BT SRUN 或 SSLEEP 状态 ， 并 在 内 存 中 停留 时 间 最 长 的 进程 
但 是 需要 满足 下 列 条 件 
° RANEETZAÁC s 间 的 时 间 大 于 或 等 于 3 秒 
e 换 出 对 象 位 于 内 存 的 时 间 大 于 或 等 于 2 秒 


图 4-3 sched() 


代码 清单 4-1 runin 和 runout (system.h) 


1 char runin; 
2 char runout; 
表 4-1 sched() 的 经 吉 束 标志 "Tu 


志 变 量 





runout 不 存在 可 作为 换 入 对 象 的 进程 








不 存在 可 作为 换 出 对 象 的 进程 


代码 清单 4-2 sched() (sys/slp.c) 





struct proc *p1; 
register struct proc *rp; 
register a, n; 


goto loop; 


sloop: 


loop: 


runin++; 
sleep(&runin, PSWP); 


/* 寻找 作为 换 入 对 象 的 进程 */ 
sple(); 
n = -1; 
for(rp = &proc[0]; rp < &proc[NPROC]; rp++) 
if(rp-»p stat--SRUN && (rp-»p flag&SLOAD)--0 && 
rp-»p time » n) ( 
p1 = rp; 
n = rp->p_time; 
} 
if(n == -1) { 
runout++; 
sleep(&runout, PSWP); 
goto loop; 


} 


sp10(); 
rp = pi; 
a - rp-»p size; 
if((rpsrp-»p textp) !- NULL) 
if(rp-»x ccount -- 0) 
a =+ rp-»x size; 
if((a-malloc(coremap, a)) !- NULL) 
goto found2; 




















/* 寻找 处 于 SWAIT 或 SSTOP 状 态 的 进程 作为 换 出 对 象 */ 

sple(); 

for(rp = &proc[0]; rp < &proc[NPROC]; rp++) 

if((rp-»p flag&(SSYS|SLOCK|SLOAD))--SLOAD && 
(rp-»p stat == SWAIT || rp-»p stat--SSTOP)) 
goto found1; 























/* 寻找 在 内 存 中 停留 时 间 最 长 的 进程 作为 换 出 对 象 */ 





46 if(n « 3) 









































47 goto sloop; 

48 n = -1; 

49 for(rp = &proc[0]; rp < &proc[NPROC]; rp++) 
50 if((rp-»p flag&(SSYS|SLOCK|SLOAD))--SLOAD && 
51 (rp-»p stat--SRUN || rp-»p stat--SSLEEP) && 
52 rp-»p time » n) ( 

53 p1 = rp; 

54 n = rp->p_time; 

55 

56 if(n < 2) 

57 goto sloop; 

58 rp = p1; 

59 

60 found1: 

61 /* 换 出 处 理 */ 

62 sp16(); 

63 rp-»p flag =& ~SLOAD ; 

64 xswap(rp, 1, 0); 

65 goto loop; 

66 

67 found2: 

68 /* 换 入 处 理 */ 

69 if((rp-pl1-»p textp) != NULL) { 

70 if(rp-»x ccount == 0) { 

71 if(swap(rp-»x daddr, a, rp-»x size, B READ)) 
72 goto swaper; 

73 rp-»x caddr = a; 

74 a -* rp-»x size; 

75 } 

76 rp->x_ccount++; 

77 } 

78 rp = p1; 

79 if(swap(rp->p_addr, a, rp->p_size, B_READ)) 
80 goto swaper; 

81 mfree(swapmap, (rp-»p size-7)/8, rp-»p addr); 
82 rp-»p addr = a; 

83 rp-»p flag -| SLOAD; 

84 rp-»p time - 0; 

85 goto loop; 

86 

87 swaper: 

88 panic("swap error"); 

89 ) 





9-11 不 存在 换 出 对 象 时 的 处 理 。 设 置 runin 标志 变量 后 进入 睡 


眠 状态 。 被 唤醒 后 ， 从 寻找 换 入 对 象 进程 处 继续 进行 交换 处 理 。 


15 将 处 理 器 优先 级 设置 为 6， 防止 发 生 中 断 。 这 是 为 了 避免 代表 
在 内 存 或 交换 空间 内 生存 时 间 的 proc.p_time 因为 时 钟 中 断 而 发 
生 改 变 。 关 于 中 断 和 处 理 器 优先 级 ， 请 参照 第 5 章 的 内 容 。 


16~27 在 处 于 可 执行 状态 (SRUN)〉 并且 处 于 被 换 出 状态 
(1SLOAD〉 的 进程 中 ， 寻 找 在 交换 空间 中 停留 时 间 最 长 

(proc.p time 具有 最 大 值 ) 的 进程 。 如 果 不 存 在 满足 条 件 的 进 
程 ， 则 在 设置 runout 标志 变量 后 进入 睡眠 状态 。 


32~34 如 果 换 入 进程 使 用 的 代码 段 在 内 存 中 不 存在 ， 说 明 其 代码 
段 也 需要 被 换 入 内 存 ， 因 此 需要 增加 分 配给 进程 的 内 存 ， 增 加 的 长 
度 为 代码 段 的 长 度 。 


35~36 ”执行 malloc() 分 配 换 入 进程 使 用 的 内 存 。 如 果 分 配 成 
功 ， 则 跳 转 至 found2。 


3943 ”如 果 内 存 空 间 不 足 ， 需 要 将 相对 不 重要 的 进程 换 出 至 交换 
空间 。 首 先 寻 找 存在 于 内 存 之 中 〈SLOAD) 、 既 不 处 于 交换 处 理 
CISLOCIO 也 不 是 系统 进程 CIssYSO 的 进程 。 该 进 程 还 必须 满 
足下 述 条 件 。 优 先 级 大 于 等 于 0， 处 于 睡眠 状态 CSWAITO 或 者 因 
跟踪 处 理 处 于 停止 状态 CSSTOPO 。 如 果 找 到 满足 上 述 条 件 的 进 
程 ， 则 跳 转 至 foundi. 


46~58 ”如 果 没 有 找到 满足 条 件 的 进程 ， 则 放宽 进行 换 出 处 理 的 条 
件 。 但 是 ， 如 果 作 为 换 入 对 象 的 进程 距 上 次 换 出 的 时 间 小 于 3 秒 ， 
设置 runin 标志 变量 后 会 进入 睡眠 状态 。 


寻找 处 于 睡眠 状态 (SSLEEP， 此 时 优先 级 为 负 值 ) 或 可 执行 状态 
CSRUND , FH AAF Cproc.p time 具有 最 大 值 ) 
的 进程 。 但 是 ， 如 果 该 进程 距 上 次 换 入 的 时 间 小 于 2 秒 ， 设 置 
runin 标志 变量 后 会 进入 睡眠 状态 。 


62~65 ”执行 换 出 处 理 。 在 清除 换 出 对 象 进程 的 SLOAD 标志 位 之 
后 ， 调 用 xswap() 进行 换 出 处 理 。 该 函数 的 第 2 个 参数 设 定 为 1， 
表示 将 从 内 存 中 释放 对 象 进 程 。 换 出 处 理 结束 后 ， 返 回 loop 并 再 
次 选择 作为 换 入 对 象 的 进程 。 


























67-85 ”执行 进程 的 换 入 处 理 。 首 先 换 入 代码 段 ， 如 果 进 程 所 需 的 
代码 段 在 内 存 中 不 存在 ， 则 调用 swap) 将 其 换 入 内 存 。 关 于 
swap() 的 详细 介绍 请 见 第 7 章 。 换 入 处 理 结束 后 ， 用 代码 段 的 物 
理 地 址 设置 text[ ] 中 代表 该 代码 段 的 元 素 ， 同 时 递增 参照 计数 器 
以 反映 内 存 中 的 进程 对 代码 段 的 参照 次 数 。 然 后 换 入 数据 段 。 执 行 
swap() 进行 换 入 处 理 。 释 放 位 于 交换 空间 的 数据 段 ， 更 新 proc] 
元 素 后 返回 1oop， 再 次 寻找 是 否 还 存在 其 他 的 换 入 对 象 。 





xswap() 


xswap() 是 用 来 对 进程 的 数据 段 进行 换 出 处 理 的 函数 〈 表 4-2, [Oni 
单 4-3 ) 。 通 过 参数 可 以 指定 被 换 出 的 数据 段 是 否 需要 从 内 存 中 释放 。 
如 果 需 要 释放 ， 则 将 被 换 出 的 数据 段 从 内 存 移动 至 交换 空间 。 如 果 不 需 
要 释放 ， 则 将 其 从 内 存 复 制 到 交换 空间 。newproc() 使 用 xswap() 的 
从 内 存 复制 到 交换 空间 的 功能 (图 4-4 ) 。 








交换 空间 


内 存 


xswap() 


是 否 释放 
内 存 由 函 
数 的 参数 


决定 通过 malloc() 分 配 


图 4-4 xswap() 


K 4-2 xswap0 的 参数 

















p proc[] 元 素 ， 代 表 被 换 出 的 进程 








是 否 释放 内 存 的 标志 








OS) 


register *rp, a; 


rp = p; 
if(os == 0) 
OS = rp-»p size; 
a = malloc(swapmap, (rp-»p size-7)/8); 
if(a == NULL) 
panic("out of swap space"); 
xccdec(rp-»p textp); 
rp-»p flag -| SLOCK; 
if(swap(a, rp-»p addr, os, 0)) 
panic("swap error"); 
if(ff) 
mfree(coremap, os, rp-»p addr); 
rp-»p addr = a; 
rp-»p flag =& -(SLOAD|SLOCK); 
rp-»p time - 0; 
if(runout) ( 
runout = ð; 
wakeup(&runout); 





7-8 如 果 第 3 个 参数 os 的 值 为 0， 将 其 设置 为 换 出 对 象 进程 的 数 
据 段 的 长 度 。 


9~11 分 配 交 换 空间 。malloc() 返回 交换 磁盘 的 块 编号 。 


12 执行 xccdec()， 递 减 换 出 对 象 进 程 所 参照 的 代码 段 的 参照 计 
数 器 ， 该 计数 器 反映 内 存 中 的 进程 对 此 代码 段 的 参照 次 数 。 


13 设置 换 出 对 象 进 程 的 SLOCK 标志 位 《表示 处 于 交换 处 理 
HR). 


14415 执行 swap() 进行 换 出 处 理 。 


16~17 ”如 果 第 2 个 参数 ff 不 为 0， 则 从 内 存 中 释放 换 出 对 象 进程 
的 数据 段 。 


18-20 将 换 出 的 对 象 进程 的 数据 段 的 地 址 换 成 为 其 分 配 的 交换 空 
间 的 地 址 〈 块 编号 ) 。 清 除 SLOAD 和 SLOCK 标志 位 ， 并 将 在 交换 
空间 内 表示 滞留 时 间 的 proc.p_time 清 0。 


21~24 ”如果 设置 了 runout 标志 变量 〈 表 示 不 存在 可 换 入 的 进 
程 ) ， 则 会 启动 调度 器 。 











4.2 ”共享 代码 段 的 处 理 


代码 段 是 用 来 容纳 程序 指令 的 只 读 区 域 。 因 为 指令 不 会 发 生变 化 ， 所 以 
如 果 革 个 程序 同时 存在 多 个 运行 中 的 进程 ， 这 些 进程 将 共享 同一 个 代码 
段 。 通 过 这 种 方式 可 以 节约 内 存 的 使 用 量 。 


代码 段 通过 text 结构 体 的 数组 text[] 进行 管理 (代码 清单 4-4， 代 三 
清单 4-5， 表 4-3 ) . text[] 的 每 个 元 素 分 别 对 应 一 个 代码 段 。 各 个 进 
程 所 使 用 的 text[] 元 素 由 proc.p textp 设 定 。 在 多 个 进程 共享 代码 
段 时 ， 这 些 进 程 将 指 问 text[ ] 的 同一 个 元 素 。 代 码 段 的 长 度 由 

user.u tsize 表示 (图 4-5 ) 。 

text[] WARAH] inode[ ] 中 对 应 程序 执行 文件 的 元 素 指针 。 内 核 
通过 此 处 的 设 定 来 判断 是 否 存在 多 个 进程 试图 运行 同一 个 程序 。 如 果 程 
序 执行 文件 作为 代码 段 使 用 ， 那 么 将 设置 inode[] 中 对 应 该 文件 元 素 
的 ITEXT 标志 位 。 关 于 inode[] 将 在 第 9 章 进 行 详细 介绍 。 


代码 清单 4-4 text[] Ctext.h) 











struct text 
{ 


1 

2 

3 int x daddr; 
4 int x caddr; 
5 int X size; 
6 

7 

8 

9 


int *x iptr; 

char — x count; 

char — x ccount; 
) text[NTEXT]; 





代码 清单 4-5 NTEXT (param.h) 


1 #define NTEXT 40 


表 4-3 text 结构 体 





交换 磁盘 中 的 地 址 (1 个 块 =512 字 节 ) 
读 入 内 存 时 的 物理 内 存 地 址 (以 64 字 节 为 单位 
代码 段 的 长 度 〈 以 64 字 节 为 单位 ) 




















指向 inode[] 中 对 应 程序 执行 文件 的 元 素 
以 所 有 进程 为 对 象 的 参照 计数 器 
以 内 存 中 的 进程 为 对 象 的 参照 计数 器 


proc[] T text] 代码 段 











user.u tsize 


图 4-5 ”进程 间 共 享 代码 段 

当 内 存 中 的 所 有 进程 不 再 参照 某 个 代码 段 时 ， 该 代码 段 将 从 内 存 中 被 释 
放 。 当 所 有 进程 不 再 参照 text[] 的 某 个 元 素 时 ， 此 元 素 对 应 的 代码 段 
将 从 交换 空间 中 被 释放 ， 同 时 该 元 素 也 将 被 释放 。 为 了 区 分 上 述 两 种 情 
况 ，text 结构 体 拥有 两 种 参照 计数 器 ， 分 别 是 以 所 有 进程 为 对 象 的 参 

照 计 数 器 X_count， 以 及 以 内 存 中 的 进程 为 对 象 的 参照 计数 器 


X ccount. 
创建 新 的 代码 段 时 ， 需 要 按照 下 述 步骤 进行 操作 《图 4-6 . 


1. 取得 text[ ] 元 素 。 


2. 读 取 程序 的 指令 并 和 暂时 保存 到 进程 的 数据 区 域 。 
3. 对 数据 段 进行 换 出 处 理 ， 并 释放 内 存 中 的 数据 段 。 


4. 调度 器 〈proc[86]) 将 该 进程 换 入 内 存 ， 并 将 数据 段 中 的 指令 作为 代 
码 段 配置 到 进程 的 虚拟 地 址 空间 中 。 


如 果 所 需 的 代码 段 已 经 位 于 内 存 之 中 ， 则 省 略 上 述 处 理 。 


如 果 所 需 的 代码 段位 于 交换 空间 中 ， 则 省 略 上 述 1~3 的 人 处理。 如 果 
inode[] 中 设置 了 对 应 程序 执行 文件 元 素 的 Sticky Bit〈 即 设置 了 
inode.i mode 的 ISVTX 标志 位 ) ,即使 代码 段 没 有 被 任何 进程 参照 也 
不 会 从 交换 空间 释放 。Shell 等 使 用 频率 较 高 的 程序 通常 会 设置 Sticky 
Bit， 这 样 可 以 通过 省 略 上 述 1~3 的 处 理 改善 程序 的 启动 速度 














磁盘 内 存 交换 空间 









数据 段 
( 临时 ) 


代码 段 







换 入 
by proc[O] 


图 4-6 ”代码 段 的 创建 
xalloc() 


xalloc() 将 代码 段 分 配给 执行 进程 〈 表 4-4， 人 代码 清单 4-6 ) 。 该 函数 
只 被 exec() 调用 。 





xalloc() 从 text[] 中 寻找 未 使 用 的 元 素 ， 同 时 检查 所 需 代码 段 是 否 
己 经 存在 于 text[] 中 。 如 采 已 经 存在 , 则 将 该 元 素 分 配给 进程 。 


如 果 所 需 的 代码 段 在 text[] 中 不 存在 ， 且 text[] 中 存在 未 使 用 的 元 
素 时 ， 将 该 元 素 分 配给 进程 。 在 将 程序 的 指令 读 取 到 数据 段 后 ， 将 数据 
段 换 出 至 交换 空间 。 对 inodef[ ] 中 对 应 程序 执行 文件 的 元 素 设 置 
ITEXT 标志 位 ， 将 其 标明 为 代码 段 ， 然 后 递增 该 inode[ ] TAWAR 
计数 器 。 代 码 段 的 换 入 处 理由 sched[ ] 进行 。 


K 4-4 xalloc() 的 参数 














register struct text *xp; 
register *rp, ts; 


if(u.u arg[1] == ð) 
return; 
rp - NULL; 
for(xp = &text[0]; xp « &text[NTEXT]; xp++) 
if(xp-»x iptr -- NULL) ( 
if(rp == NULL) 
rp = xp; 
) else 
if(xp-»x iptr -- ip) ( 
Xp-»x count; 
u.Uu procp-»p textp = xp; 
goto out; 


} 
if((xp=rp) == NULL) 
panic("out of text"); 
xp->x_count = 1; 
Xp-»x ccount = 0; 


24 xp-»x iptr = ip; 


25 ts = ((u.u arg[1]463)»»6) & 01777; 
26 Xp-»x size - ts; 

27 if((xp-»x daddr = malloc(swapmap, (ts47)/8)) == NULL) 
28 panic("out of swap space"); 

29 expand(USIZE-ts); 

30 estabur(0, ts, 0, 0); 

31 u.u count - u.u arg[1]; 

32 u.u offset[1] = 0206; 

33 u.u base = 6; 

34 readi(ip); 

35 rp = u.u procp; 

36 rp-»p flag -| SLOCK; 

37 swap(xp-»x daddr, rp-»p addr4USIZE, ts, 0); 
38 rp-»p flag -& -SLOCK; 

39 rp-»p textp = xp; 

40 rp = ip; 

41 rp-»i flag -| ITEXT; 

42 rp-»i Count++; 

43 expand(USIZE); 

44 

45 out: 

46 if(xp-»x ccount == 0) { 

47 savu(u.u rsav); 

48 savu(u.u ssav); 

49 xswap(u.u procp, 1, 0); 

50 u.u procp-»p flag -| SSWAP; 

51 swtch(); 

52 } 

53 xp->x_ccount++; 

54 } 





78 代码 段 的 长 度 为 0 时 不 做 任何 处 理 。u.u_arg[1] 由 exec() 


设置 为 程序 执行 文件 的 代码 长 度 〈 以 字 节 为 单位 ) 。 

9~21 在 text[] 中 寻找 未 使 用 元 素 。 如 果 所 需 的 代码 段 已 存在 于 
text[] 中 ， 将 该 代码 段 的 参照 计数 器 加 1， 并 将 执行 进程 指向 该 
text[] 元 素 。 

22-26 ”对 取得 的 text[] 元 素 进行 初始 化 。 


27-28 ”分配 交换 空间 。malloc() 返回 交换 磁盘 的 块 编号 。 





29-30 ”为 了 将 程序 的 指令 读 取 至 数据 区 域 ， 执 行 
expand(). estabur() 更 新 用 户 空 间 。 以 用 户 空间 的 地 址 0 为 起 
点 ， 分 配 与 程序 文件 代码 数据 相同 长 度 的 内 存 作 为 数据 区 域 。 


31~34 ”将 代码 段 配 置 于 虚拟 地 址 0 的 位 置 。u.u_offset[1] = 
020 表示 跳 过 程序 执行 文件 的 文件 头 。 


36~38 ”执行 swap()， 将 《容纳 着 代码 数据 的 ) 数据 段 换 出 内 存 。 
在 进行 交换 处 理 的 过 程 中 保持 已 设置 SLOCK 标志 位 的 状态 。 


39~42 将 text[ ] 元 素 分 配给 进程 ， 并 设置 与 代码 段 相 对 应 的 
inode[] 元 素 的 参数 。 


43 执行 expand()， 将 数据 段 压 缩 至 最 小 长 度 。 


45~52 ”如 果 没 有 任何 内 存 中 的 进程 参照 程序 文件 的 代码 数据 ， 则 
将 进程 (数据 段 〉 暂 时 换 出 内 存 。 此 时 ， 数 据 段 中 只 包含 最 低 限 度 
的 数据 (PPDA) 。 然 后 执行 swtch() 切换 执行 进程 。 当 进程 再 次 
执行 时 ， 从 退出 xalloc() 的 位 置 开 始 继续 处 理 。 


53 将 代码 段 参 照 计数 右 加 1， 该 计数 锅 表 示 内 存 中 的 进程 对 代码 
段 的 参照 数量 。 























xfree() 


xfree() 用 来 递减 执行 进程 使 用 的 代码 段 的 参照 计数 器 代码 清单 4-7 
) ， 包 括 以 内 存 中 的 进程 为 对 象 的 计数 器 ， 和 以 所 有 进程 为 对 象 的 计 
数 器 。 当 后 者 的 值 为 0 时 ,执行 mfree() 释放 位 于 交换 空间 的 代码 段 ， 
并 释放 text[] 中 相应 的 元 隶 。 但 是 ， 当 与 代码 段 相 对 应 的 inode[] 
元 素 的 ISVTX 标志 位 〈Sticky Bit) 被 设置 时 ， 不 进行 上 述 的 释放 处 
HE. 








代码 清单 4-7 xfree() Cken/text.c) 





1 
2 
3 register *xp, *ip; 
4 
5 


if((xp-zu.u procp-»p textp) !- NULL) { 


6 u.u procp-»p textp - NULL; 
7 xccdec(xp); 
8 if(--xp-»x count -- 0) ( 


9 ip = xp-»x iptr; 

10 if((ip-»i mode&ISVTX) == 0) ( 

11 xp-»x iptr = NULL; 

12 mfree(swapmap, (xp-»x size-7)/8, xp-»x daddr); 
13 ip-»i flag =& -ITEXT; 

14 iput(ip); 

15 } 

16 } 

17 

18 ) 





5 如 果 执 行进 程 没 有 使 用 代码 段 ， 则 不 做 任何 处 理 。 


执行 xccdec()， 递 减 以 内 存 中 的 进程 为 对 象 的 的 代码 段 参照 计 
xccdec() 
xccdec() 用 来 递减 以 内 存 中 的 进程 为 对 象 的 代码 段 参照 计数 器 〈 表 4- 
5， 代 码 清单 4-8 ) 。 当 参照 计数 器 为 0 时， 执行 mfree() 以 释放 内 存 
中 的 代码 段 。 


表 4-5 xccdec() 的 参数 





代码 清单 4-8 xccdec() (sys/text.c) 





1 xccdec(xp) 


2 int *xp; 
3 1 
4 register *rp; 


5 


if((rp=xp)!=NULL && rp-»x ccount!-0) 
if(--rp-»x ccount -- 0) 
mfree(coremap, rp-»x size, rp-»x caddr); 


6 
7 
8 
9 





43 小 结 

。 通过 交换 处 理 和 共享 代码 段 可 以 有 效 利 用 有 限 的 内 存 。 
proc[8] 定 期 进行 交换 处 理 。proc[8] 被 称 为 调度 进程 或 调度 器 。 
母 一 次 交换 处 理 都 会 持续 至 不 再 存在 可 交换 对 象 为 止 。 


代码 段 在 被 读 取 至 内 存 时 ， 在 交换 空间 中 也 会 保留 一 份 相同 的 数 
据 。 反 之 ， 数 据 段 在 被 换 入 内 存 时 ， 交 换 空 间 中 的 数据 将 被 释放 。 


代码 段 拥 有 两 个 参照 计数 器 。 
如 末代 码 段 不 再 被 内 存 中 的 任何 进程 参照 ， 将 从 内 存 中 被 释放 。 
如 果 代 码 段 不 再 被 任何 进程 参照 ， 将 从 交换 空间 中 被 释放 。 


如 果 设 定 了 Sticky Bit， 则 不 会 从 交换 空间 中 释放 代码 段 。 这 样 可 
以 加 快 启 动 速度 。 


。 代码 段 首先 在 交换 空间 中 生成 ， 随 后 被 读 取 人 至 内 存 。 








A^ DA 小 
第 III 部 分 FRI 
周边 设备 发 出 的 请 求 以 及 CPU 内 部 特定 的 事件 ,以 中 断 或 陷入 的 形式 加 
以 处 理 。 执 行 中 的 进程 将 暂停 运行 , 转 而 处 理发 生 的 中 断 或 陷入 。 待 处 
理 完 成 后 ,被 暂停 的 进程 再 次 恢复 运行 。 此 外 ,系统 调用 也 是 通过 陷入 的 
机 制 加 以 实现 的 。 第 III 部 分 主要 对 以 下 内 容 进行 介绍 。 

e 与 中 断 相 对 应 的 处 理 是 如 何 被 调用 的 

e 执行 中 的 进程 是 如 何 和 暂停 运行 ,又 是 如 何 被 恢复 的 

e 系统 调用 是 如 何 实 现 的 


通过 阅读 本 部 分 的 内 容 , 对 实现 高 效 处 理 CPU 内 外 发 生 事件 的 方法 应 该 
会 有 比较 清晰 的 理解 。 














At xz yz FT 

7855 rp 

5.1. 什么 是 中 断 与 陷入 

什么 是 中 断 

中 断 是 指 用 来 实现 下 述 处 理 的 机 制 ， 当 周边 设备 发 出 请 求 时 ， 和 暂停 执行 
中 的 进程 ， 转 而 执行 与 请 求 相对 应 的 处 理 。 待 处 理 完成 后 再 恢复 被 暂停 
的 进程 。 对 中 断 请 求 进行 处 理 的 函数 被 称 为 中 断 处 理 函 数 。 

中 断 请 求 包 括 下 述 几 种 类 型 。 

。 块 设备 处 理 完成 通知 

。 终 端 输入 

e 时 钟 中 断 

通过 中 断 能 够 实现 如 下 功能 。 比 如 ， 当 某 进程 在 癌 块 设备 提出 处 理 请 求 
后 ， 在 等 待 设备 处 理 完成 之 前 ,系统 可 以 先 处 理 其 他 进程 (图 5-1 ) 。 
如 果 没 有 中 断 的 机 制 ， 提 出 请 求 的 进程 必须 定期 检查 设备 是 否 发 出 了 处 
理 结束 的 通知 。 这 种 方式 被 称 为 轮 询 。 与 处 理 器 相 比 ， 周 边 设 备 的 处 理 
速度 比较 慢 ， 因 此 ， 轮 训 所 花费 的 时 间 也 会 比较 长 (图 5-2 ) 。 

由 此 可 知 ， 中 断 是 一 种 对 进程 运行 和 异步 事件 进行 高 效 处 理 的 机 制 。 











进程 1 进程 2 时 间 










swtch() 





:  Sleep() 
: SSLEEP 


: 变 成 内 核 进程 ， 
ee 进行 与 中 断 相对 
| 应 的 处 理 


Wakeup() 


由 于 硬件 处 理 结束 后 将 发 生 中 断 ， 因 此 可 以 先 处 理 其 他 进程 


图 5-1 "BI 


磁盘 设备 进程 1 进程 2 时 间 


执行 指示 ; 


需要 逐一 检查 硬件 的 处 理 是 否 已 经 结束 
图 5-2 轮 询 


中 断 处 理 函 数 由 内 核 进程 负 责 执行 。 在 运行 用 户 进程 时 发 生 中 断 的 
话 ， 则 通过 硬件 切换 至 内 核 进程 。 


被 中 断 的 进程 的 数据 暂 存 于 内 核 栈 之 中 。 当 中 断 处 理 函 数 结束 后 ， 将 
恢复 内 核 栈 中 的 数据 ， 并 继续 处 理 被 中 断 的 进程 。 


什么 是 陷入 


陷入 与 前 述 的 中 断 一 样 ， 会 引起 执行 进程 的 暂停 和 恢复 处 理 。 与 中 断 的 
不 同 之 处 在 于 ， 陷 入 是 由 CPU 内 部 的 事件 引起 的 。 

当 程 序 执行 中 发 生 异 常 时 ， 会 设置 PSW 的 陷入 位 (PSW[4]) ， 表 示 陷 
入 被 触发 。 异 名 包括 以 下 情况 。 

e 被 0 除 

e 访问 了 未 被 分 配 的 区 域 

e 总 线 超时 

因为 存在 陷入 机 制 ,所 以 用 户 程序 不 必 每 次 都 确认 异常 情况 ,或 逐一 处 

理 。 当 异常 出 现时 会 触发 陷入 ， 并 目 动 执行 共用 的 处 理 。 当 某 种 陷入 发 
生 时 ， 如 果 希 望 在 对 其 进行 适当 处 理 后 继续 原来 的 操作 ， 可 以 定义 独自 
的 陷入 处 理 函 数 来 实现 。 

由 内 核 进程 触发 的 陷入 ， 通 常 应 由 独自 定义 的 陷入 处 理 函 数 处 理 。 内 核 
程序 在 执行 可 能 会 触发 陷入 的 指令 前 ， 将 变量 nofault 设 定 为 与 此 陷 

E a 当 陷 入 发 生 时 ，nofault 指向 的 处 理 函 数 
将 目 动 执行 。 


用 户 程 序 触发 的 陷入 最 终 作 为 信号 被 处 理 《〈 人 参见 第 6 32) 。 通 过 对 信 
写 设 定 处 理 函数 ， 在 异常 及 生 时 可 以 进行 独自 处 理 。 


什么 是 系统 调用 
面 己 经 讲 过 ， 用 户 程序 通过 系统 调用 的 机 制 ， 访 问 内 核 提 供 的 各 种 功 


o 











前 
能 


由 于 用 户 程序 不 能 直接 操作 内 核 的 功能 ， 因 此 具有 下 述 优点 。 
° 可 以 防止 用 户 程 序 因 无 意 或 有 意 执行 了 可 能 会 对 系统 造成 危害 的 指 
A 








。 用 户 程序 无 须 了 解 内 核 凡 部 进行 的 复杂 处 理 


当 用 户 程序 执行 系统 调用 后 ， 内 核 进 程 会 进行 相应 的 处 理 。 从 用 户 进程 
切换 到 内 核 进程 并 进行 相应 处 理 的 过 程 ,都 是 利用 陷入 实现 的 。 


用 户 程 序 执行 汇编 器 的 sys 指令 后 会 触发 表示 系统 调用 的 陷入 。 系 统 调 
用 存在 多 种 类 型 ， 通 过 sys 指令 的 第 1 个 参数 指定 。 有 的 系统 调用 还 带 
有 自己 的 参数 。 参 数 的 指定 方法 因 系统 调用 种 类 的 不 同 而 不 同 , 具 体 请 
参考 UPM (2) 的 说 明 。 


sys 指令 为 汇编 器 的 模拟 指令 ，PDP-11/40 中 实际 触发 陷入 的 指令 为 
trap. trap 指令 的 低位 比特 含有 表示 陷入 种 类 的 值 。 汇 编 右 将 sys 指 
令 和 第 1 个 参数 ， 编 码 为 trap 指 令 。 











52 ”优先 级 与 同 量 CVector) 


中 断 优 先 级 和 处 理 器 优先 级 


中 断 中 含有 从 0 到 7 的 中 断 优 先 级 。 当 PSW 中 的 处 理 器 优先 级 
(PSW[7-5]) 大 于 或 等 于 中 断 优 移 级 时 ,该 中 断 不 会 被 处 理 。 周 边 设备 
p LIS 直到 处 理 需 优先 级 下 降 ， 该 中 断 得 到 处 理 为 上 
CÉd 5-3) . 





周边 设备 1 周边 设备 2 | 执行 进程 
| 处理 器 优先 级 5 
| 断 优先 级 5 | | 
1 -中 断 优先 级 5 ， 不 做 处 理 
持续 发 出 I i 
kde !' 中 断 优先 级 6 
一 一 一 | 一 * 进 行 处 理 
| | 处理 器 优先 级 4 
一 区 进行 处 理 


图 5-3 中 断 的 掩 码 


处 理 器 优先 级 可 以 通过 spln() 函数 (n 为 整数 ) 进行 变更 (代码 清单 
5-1 ) 。 


代码 清单 5-1 spln() (conf/m40.s) 





1 .globl _splð, spl1, spl4, spl5, spl6, spl7 
2 Sple: 
3 bic $340,PS 


4 rts pc 


7 bis $40,PS 
8 bic $300,PS 
9 rts pc 

10 

11 spl4 

12 spl5 

13 bis $340,PS 
14 bic $100,PS 
15 rts pc 

16 

17 spl6 

18 bis $340,PS 
19 bic $40,PS 
20 rts pc 

21 

22 Sspl7 

23 bis $340,PS 

24 rts pc 
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程 中 也 可 以 提高 处 理 占 优先 级 。 但 是 用 小 于 中 断 优先 级 的 处 理 占 优先 
级 执行 中 断 处 理 函 数 会 导致 一 些 问题 。 在 运行 中 断 处 理 函 数 时 ， 如 果 





再 次 收 到 相同 类 型 的 中 断 请 求 ， 中 断 与 由 中 断 处 理 引 起 的 副作用 在 发 生 
的 顺序 上 会 出 现 逆 转 。 比 如 说 ， 在 终端 里 输入 文字 列 后 ， 文 字 列 会 按照 
与 输入 时 不 同 的 顺序 显示 (图 5-4 ) 。 





执行 进程 中 断 1 的 处 理 中 断 2 的 处 理 





中 断 1 发 生 
| 中 断 2 发 生 
| 由 中 断 2 引起 的 
| | 副作用 
由 中 断 1 引 起 的 
| 副作用 


中 断 的 发 生 顺 序 为 1 一 2， 而 终端 副作用 的 顺序 为 2 一 1 
图 5-4 中 断 处 理 的 顺序 发 生 逆 转 


陷入 的 优先 级 相当 于 中 断 优先 级 的 8。 无 论 当 前 处 理 器 优先 级 的 值 是 
多 少 , 当 陷 入 发 生 时 都 会 马上 得 到 处 理 。 


FE LIBRI REA A In] ec 

中 断 和 陷入 拥有 相应 的 中 断 和 陷入 同 量 。 中 断 和 陷入 癌 量 是 一 些 预 设 
的 PSW 值 和 pc 值 的 存放 地 址 ,内 核 进程 在 开始 处 理 中 断 和 陷入 时 会 使 用 
这 些 预 设 值 来 设置 PSW 和 pc 寄存 器 。 


有 具 有 代表 性 的 中 断 和 陷入 向 量 如 表 5-1、 表 5-2 所 示 。 表 5-1 同时 显示 
了 中 断 优 先 级 。 


表 5-1 øE 


| 








设备 中 断 优 先 级 [H] 5 


(输入 ) 





























行 打印 机 LP-11 


块 设备 RK-11 





表 5-2 KAHNE 


总 线 超时 


指令 错误 


iot 输入 输出 陷入 ) 





模拟 陷入 指令 





sys(trap) 指 令 034 


浮动 小 数 点 错误 


段 错误 





5.3 ”中断 和 陷入 的 处 理 流 程 

中 断 和 陷入 由 发 生 到 处 理 结束 基本 遵循 相同 的 处 理 流 程 〈 图 5-5 ) 。 
1. 发 生 中 断 或 陷入 

2. 将 当前 的 PSW 与 pc 保存 于 内 核 栈 

3. 从 向 量 指定 的 地 址 读 取 PSW 和 pc 

4. 执行 call 或 trap 

5. 执行 中 断 处 理 函数 或 陷入 处 理 函 数 

6. 从 内 核 栈 中 恢复 PSW 和 pc 


周边 设备 内 部 事件 执行 进程 内 核 进程 
! 向 量 所 示 地 址 


T 
7| le 


' [sou ch pr. 
2 | Sp. PSW 陷入 处 理 
PSW, pc 
( 硬件 ) i "us | 


内 核 栈 
Nt oe 


( csv ) 






I2. r3. r4. [b 


cret 
XR i5 i 


~ 





图 5-5 中 断 和 陷入 

发 生 中 断 或 陷入 

当中 断 或 陷入 发 生 并 通知 系统 后 ,执行 进程 的 PSW 和 pc 将 被 压 入 内 核 
栈 ， 然 后 从 与 中 断 或 陷入 通知 一 起 送 来 的 回 量 指 问 的 地 址 中 读 取 并 设置 
PSW 和 pc。 此 处 理 通 过 硬件 完成 。 


更 新 PSW 后 ， 执 行进 程 变 为 内 核 进 程 。 将 pc 设置 为 与 此 中 断 或 陷入 的 
种 类 相对 应 的 地 址 ， 这 使 得 系统 开始 执行 中 断 或 陷入 处 理 。 


接 下 来 看 一 下 位 于 内 核 程序 低位 地 址 的 代码 ， 此 处 容纳 与 向 量 相 对 应 的 
数据 《代码 清单 5-2 ) 。 














代码 清单 5-2 内核 低位 地 址 (unix/low.s) 





1 

2 

3 br4 = 200 

4 br5 = 240 

5 br6 = 300 

6 br7 = 340 

7 

8 . = 0^. 

9 br 1f 

10 4 

11 

12 / trap vectors 

13 trap; br740. / bus error 

14 trap; br741. / illegal instruction 
15 trap; br742. / bpt-trace trap 
16 trap; br743. / iot trap 

17 trap; br744. / power fail 

18 trap; br745. / emulator trap 
19 trap; br7«46. / system entry 
20 

21. - 40^. 

22 .globl start, dump 

23 1: jmp start 

24 jmp dump 

25 

26 . = 60^. 

27 klin; br4 

28 klou; br4 

29 

30 . = 100^. 

31 kwlp; br6 

32 kwlp; br6 

33 

34 . = 114^. 

35 trap; br7+7. / 11/70 parity 
36 

37 . = 214^. 

38 tcio; br6 

39 
40 . = 224^. 
41 tmio; br5 
42 
43 - 240^. 
44 trap; br747. / programmed interrupt 
45 trap; br748. / floating point 


46 trap; br749. / segmentation violation 


48 . = 254^. 

49 hpio; br5 

50 

51 /VIMIMMMmIINIIMMBPMGM«MP««PCP«PPPMPHEPEPIMIEPLMIPPMIEPP MI BTgMIMIMP 
52 / interface code to C 


53 TP BM PB BB IE EPPB BB VEHI TEP LL TEETH TB B TB BP LEITET DEFLT 
55 .globl call, trap 


57 .globl  klrint 
58 klin: jsr rO,call; klrint 
59 .globl  klxint 
60 klou: jsr rO,call; klxint 


62 .globl _clock 
63 kwlp: jsr rO,call; clock 


64 

65 .globl  tcintr 

66 tcio: jsr rO,call; tcintr 
67 

68 .globl _tmintr 

69 tmio: jsr rO,call; tmintr 
70 


71 .globl _hpintr 
72 hpio: jsr rO,call; hpintr 





发 生 中 段 时 的 处 理 


假设 当前 发 生 了 中 断 问 量 为 0100 的 时 钟 中 断 ， 下 面 以 此 为 前 提 进 行 说 
明 。 


第 30 行 的 . = 100^. 表示 当 程 序 被 恋 入 内 存 时 ， 此 处 的 地 址 为 0100。 

第 31 行 的 两 个 字 kwlp 和 br6 分 别 保存 在 pc 和 PSW 中 。 因 为 bre 的 
0300， 所 以 处 理 器 优先 级 PSW[7-5] 的 值 为 6。 由 于 将 pc 设 定 为 
kwlp， 因 此 中 断 处 理 从 kwlp 标签 的 位 置 开始 执行 。 


kwlp 标签 所 在 的 第 63 行 的 jsr 指令 首先 被 执行 。jsr rð, call; 
_clock 将 re 的 值 压 入 栈 ， 并 将 pc WEN call 标签 指向 的 地 址 。 然 
后 将 r0 设 定 为 _clock (clock() 函数 ) 的 地 址 。 此 处 re 指向 的 函数 
即 为 中 断 种 类 对 应 的 中 断 处 理 函数 CE 5-3， 表 5-4 ) 。 


K 5-3 ”内核 栈 的 状态 





- 被 中 断 进 程 的 pc 
m 被 中 断 进 程 的 PSW 


K 5-4 寄存 右 的 状态 


























_clock《〈 中 断 处 理 函 数 clock() 的 地 址 ) 


发 生 陷 入 时 的 处 理 


下 面 考虑 一 下 由 sys 指令 触发 的 陷入 的 情况 。sys 指令 的 陷入 问 量 为 
034。 第 19 fT HJ trap ; br7+6 分 别 保 存在 pc 和 PSW hi. 由 于 br7 的 
值 为 0340， 因 此 处 理 器 优先 级 PSW[7-5] 的 值 为 7。 另外 ，PSW 低位 
的 3 比特 记录 了 陷入 的 种 类 ， 此 处 的 值 为 6。 


ee 


执行 cal 和 trap 


用 汇编 语言 编写 的 call 和 trap 分 别 调用 相应 的 中 断 处 理 函 数 或 陷入 

处 理 函 数 〈 代 码 清单 5-3) 。 发 生 中 断 时 调用 保存 在 re 中 的 中 断 处 理 函 

2 发 生 陷 入 时 ， 如 果 nofault 被 设 定 了 陷入 处 理 函 数 ， 则 调用 该 处 
函数 ， 如 果 未 设 定 ， 则 调用 trap() 函数 。 


代码 清单 5-3 call(,trap) (conf/m40.s) 





1 .globl trap, call 
2 .globl | trap 
3 trap: 
4 mov PS, -A(sp) 
5 tst nofault 
6 bne 1f 
7 mov SSRO, ssr 
8 mov SSR2, ssr+4 
9 mov $1,SSRO 
10 jsr re,calll; trap 
11 / no return 
12 1: 
13 mov $1,SSRO 
14 mov nofault,(sp) 
15 rtt 
16 
17 .globl  runrun, _swtch 
18 call1: 
19 tst -(sp) 
20 bic $340,PS 
21 br 1f 
22 
23 call: 
24 mov PS, -(sp) 
25 1: 
26 mov r1,-(sp) 
27 mfpi sp 
28 mov A(sp), -(sp) 
29 bic $137, (sp) 
30 bit $30000,PS 
31 beq 1f 
32 jsr pc,*(re)+ 
33 2: 
34 bis $340,PS 
35 tstb . runrun 
36 beq 2f 
37 bic $340,PS 
38 jsr pc, swtch 
39 br 2b 
40 2: 
41 tst (sp)* 
42 mtpi sp 
43 br 2f 
44 1 


45 bis $30000,PS 


46 jsr pc,*(re)+ 


47 cmp (sp)+, (sp)+ 
48 2 

49 mov (sp)*,r1 

50 tst (sp)* 

51 mov (sp)+,re 

52 rtt 





中 断 处 理 的 流程 


首先 来 看 一 下 中 断 处 理 的 流程 。 处 理 从 call 标签 处 开始 执行 。 假 设 此 
时 发 生 了 时 名 中 那么 中 断 处 理 函 数 clock( ) 的 地 址 就 会 保存 在 r0 


24~26 将 PSW 与 pc 压 入 栈 。 


27 将 被 中 断 的 进程 的 sp 压 入 栈 。mfpi 指令 用 来 将 PSW 表示 的 
前 一 模式 的 虚拟 地 址 空间 的 值 压 入 当前 模式 的 地 址 空间 的 栈 项 

部 。sp 和 其 他 的 通用 寄存 器 的 不 同 之 处 在 于 存在 两 父 ， 分 别 供用 
户 模式 和 和 内 核 模式 使 用 。 内 核 进 程 在 访问 用 户 进程 的 sp 时 需要 使 
用 特殊 的 指令 。 


28 将 在 第 24 行 压 入 栈 的 PSW 再 次 压 入 栈 CK 5-5) 。 
29 将 位 于 栈 顶 部 的 PSW 的 除 低位 5 比特 之 外 的 部 分 清 0。 


30-31 检查 被 中 断 的 进程 的 模式 ， 如 果 为 内 核 模 式 则 跳 转 到 第 44 
fT« 


32 如果 被 中 断 的 进程 为 用 户 进程 ， 则 使 用 jsr 指令 跳 转 到 re TH 
癌 的 地 址 。 然 后 将 当前 pc 保存 于 栈 中 ， 作 为 从 中 断 处 理 函 数 返 回 
时 的 地 址 CX 5-6) 。 


表 5-5 栈 的 状态 












































pc《〈 从 中 断 处 理 函 回 时 的 地 址 ) 


经 过 掩 码 的 PSW 
































被 中 断 的 进程 的 pc 








被 中 断 的 进程 的 PSW 








34 从 中 断 处 理 函 数 返回 后 进行 的 处 理 。 将 处 理 器 优先 级 设置 为 7 
防止 发 生 中 断 。 


35-36 “如果 未 设置 标志 变量 runrun1， 则 跳 转 到 第 40 fr. 

37.38 ”如 果 设 置 了 标志 变量 runrun， 则 将 处 理 器 优先 级 重 置 为 
0。 由 于 与 执行 进程 〈 被 中 断 的 进程 ) 相 比 存 在 执行 优先 级 更 高 的 
进程 ， 因 此 执行 swtch() 切换 执行 进程 。 


39 当 此 进程 再 次 执行 时 ， 返 回 第 33 行 的 位 置 再 次 检查 标志 变量 


runrunc 


41 ”如 果 未 设置 标志 变量 runrun， 被 中 断 的 进程 将 再 次 获得 控制 
权 。 保 存 于 栈 中 的 经 过 掩 码 的 PSW 会 被 忽略 。 


42 恢复 保存 于 栈 中 的 被 中 断 的 进程 的 sp。mtpi 指令 用 来 复制 前 
一 处 理 吉 模式 《由 PSW 表示 ) 虚拟 地 址 空间 中 栈 顶 部 的 值 。 


43 SLE JS 48 行 。 
49-51 ”恢复 保存 在 栈 内 的 rl 和 re6， 和 忽略 PSW ( 表 5-7) 。 
x 执行 rtt 指令 ， 恢 复 保 存在 栈 中 的 被 中 断 的 进程 的 PSW 和 
, FEZ debant m ent. rtt 指令 用 来 将 栈 顶部 两 个 字 长 
的 数据 设置 到 PSW 和 pc 中 。 


45-46 被 中 断 的 进程 为 内 核 进程 时 ， 将 前 一 模式 设置 为 用 户 模 
式 ， 然 后 跳 转 到 由 re 指 同 的 中 断 处 理 函 数 的 位 置 。 
47 ”从 中 断 处 理 函 数 返回 后 ， 忽 略 栈 顶部 的 经 过 掩 码 的 PSW 以 及 


o i sp。 之 后 的 处 理 与 用 户 进程 被 中 断 时 的 处 理 相 同 
CK 5-8) 。 





— 





























Irunrun 是 全 局 进程 调度 标志 。 操 作 系 统 会 在 某 些 情况 (比如 在 发 现 有 优先 级 更 高 的 进程 可 以 
EED 下 置 runrun， 要 求 在 合适 的 时 机 (比如 此 处 〉 进 行进 程 调度 。 审 校 者 注 












































K 5-7 栈 的 状态 


mi | oma 回 时 的 地 址 ) 











































































































被 中 断 的 进程 的 sp 





























被 中 断 的 进程 的 PSW 














陷入 处 理 的 流程 
接 下 来 看 一 下 陷入 处 理 。 处 理 从 trap 标签 的 位 置 开 始 执行 。 


4 将 PSW 复制 到 距 栈 项 部 两 个 字 长 的 位 置 。 因 为 PSW 包含 着 与 
陷入 种 类 相关 的 信息 ， 因 此 需要 马上 保存 〈 表 5-9) 。 


5-6 检查 nofault， 如 果 已 设置 了 nofault， 则 跳 转 到 第 12 
行 。 


7~10 如果 未 设置 nofault， 则 保存 SRO 和 SR2 的 当前 状态 ， 初 
始 化 SRO 之 后 使 用 jsr 指令 跳 转 到 calli 的 位 置 。re 被 压 入 栈 ， 
它 保存 着 trap() 的 地 址 〈 表 5-10) 。 


表 5-9 栈 的 状态 
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被 中 断 的 进程 的 PSW 








K 5-10 栈 的 状态 





Ei 
Lr 人 代入 种 类 信息 的 PSW 





m — 


被 中 断 的 进程 的 PSW 














19-20 将 sp 癌 上 移动 一 个 位 置 ， 并 将 处 理 右 优先 级 设置 为 6。 


21 跳 转 至 第 25 行 。 n 与 中 断 处 理 时 相同 。 因为 
r0 保存 着 trap() 的 地 址 ， 所 以 可 以 通过 第 32 行 或 第 46 行 的 jsr 
指令 跳 转 到 trap() 的 位 置 。 


13-14 如果 已 设置 nofault， 则 初始 化 SR0， 然 后 将 保存 在 栈 顶 
部 被 中 断 的 进程 的 pc 值 用 nofault 的 值 蔡 换 CK 5-11) 。 

15 使 用 rtt 指令 恢复 栈 顶 部 的 PSW 和 pc。 将 pc 设置 为 
nofault 的 值 ， 控 制 权 转交 给 由 nofault 指定 的 陷入 处 理 函 数 。 
陷入 处 理 函 数 通过 rts 指令 终止 运行 。 栈 顶部 保存 着 从 触发 陷入 的 
函数 返回 时 的 地 址 ， 因 此 将 返回 至 该 地 址 〈 表 5-12) 。 


表 5-11 栈 的 状态 
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被 中 断 的 进程 的 PSW 
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5.4 时 钟 中 断 处 理 函 数 

本 节 以 时 钟 中 断 处 理 函 数 为 例 介绍 中 断 处 理 函 数 。 此 外 ， 块 设备 的 中 晰 
处 理 函 数 的 介绍 请 见 第 8 章 ， 字 符 设备 的 中 断 处 理 函 数 请 参考 第 12 
章 ， 终 端的 中 断 处 理 函 数 也 会 在 第 13 章 中 进行 介绍 。 

时 钟 设 备 的 规格 


时 钟 设备 是 用 来 定期 向 系统 发 出 中 断 请 求 的 设备 。 系 统 通 过 时 钟 中 断 
对 时 间 等 进行 管理 。 时 钟 中 断 的 间隔 被 称 为 tick. 


UNIX V6 可 以 使 用 两 种 时 钟 设 备 。 两 种 设备 中 的 某 一 种 必须 处 于 可 用 
状态 ， 两 者 都 可 用 的 时 候 KW11-L 优先 。 


。 通过 电源 频率 生成 时 钟 的 KW11-L 
e 可 编程 时 钟 KW11-P 


KW11-L 通过 电源 频率 生成 时 钟 。 时 钟 频 率 依 赖 电源 频率 ， 为 60Hz 或 
50Hz 〈 表 5-13) 。 





K 5-13 KW11-L 的 寄存 器 


比特 位 


























中 断 有 效 位 。 置 1 时 中 断 有 效 ， 清 0 时 不 引发 中 断 








此 位 由 时 钟 设备 置 1 后 将 引发 中 断 ， 通 过 程序 可 以 将 其 清 





KW11-P 为 可 编程 的 时 钟 设 备 。 时 钟 发 生 的 间隔 可 通过 程序 设 定 。 当 内 
部 计数 占 发 生 向 上 或 同 下 洲 出 时 引发 中 断 ( 表 5-14 ) 。 


表 5-14 KW11-P 的 寄存 器 
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中 断 有 效 位 。 置 1 时 中 断 有 效 ， 清 0 时 不 引发 中 此 























1: 重复 时 钟 中 断 ，0 : 只 引发 1 次 时 钟 中 断 


时 钟 中 断 间 隔 。00 : 100KHz. 01: 10KHz，10 : 电源 频率 ，11 : 由 外 部 设 
备 输入 引发 


系统 管理 者 通过 param.h 中 的 HZ 来 设 定时 钟 频 率 ， 并 根据 需要 重新 构 
筑 系 统 内 核 〈 代 码 清单 5-4 ) 。 


代码 清单 5-4 HZ Cparam.h) 


1 #define HZ 60 


以 下 内 容 以 时 钟 频率 等 于 60Hz 为 前 提 进 行 说 明 。 
时 钟 中 断 处 理 函 数 的 内 容 


时 钟 中 断 是 定期 发 生 的 ， 时 钟 中 断 处 理 函 数 在 中 断 发 生 时 会 进行 下 述 处 
理 ， 同 时 以 1 秒 和 4 秒 的 周期 进行 相应 的 处 理 ( 图 5-6 ) 。 











。 时 钟 中 断 发 生 时 的 处 理 


。 再 次 设 定时 钟 设 备 的 寄存 器 
o 在 指定 时 刻 执 行事 先 登 录 的 函数 
o 递增 CPU 时 间 
以 1 秒 为 周期 进行 的 处 理 
o 时 间 处 理 
唤起 通过 系统 调用 sleep 的 进程 
对 进程 的 执行 优先 级 进行 再 计算 
尝试 对 进程 进行 再 调度 
对 信号 进行 处 理 
以 4 秒 为 周期 进行 的 处 理 


o 


o 


Oo 


o 


o lightning bolt 


时 钟 设备 


执行 进程 


图 5-6 ”时 钟 中 断 
时 钟 设备 寄存 器 的 再 设 定 
清除 时 钟 设 备 寄存 器 中 的 中 断 发 生 位 ， 使 时 钟 中 断 可 以 再 次 被 触发 。 


定时 执行 


—> clock() 


———)» clock() 


一 一 -一 > clock() 


———» clock() 


一 一 -一 > clock() 


内 核 进程 





时 间 


以 1 秒 为 周期 __ lbolt 处 理 


进行 的 处 理 


TED 





一 一 > 以 1 秒 为 周期 


进行 的 处 理 


一 一 > 以 1 秒 为 周期 


进行 的 处 理 


以 1 秒 为 周期 
进行 的 处 理 


4 秒 


一 一 > |bolt 处 理 


内 核 通 过 timeout() 函数 可 以 指定 汞 个 函数 在 某 个 时 钟 tick 后 执行 。 
时 钟 中 断 处 理 函 数 在 上 述 指 定 的 时 刻 执 行 该 函数 。 内 核 利 用 callo 结 
构 体 的 数组 callout[] 管理 需要 定期 执行 的 函数 〈 代 码 清单 5-5， 代 码 


清单 5-6， 表 5-15 ) 。 


代码 清单 5-5 callo (system.h) 


1 struct 
2 { 


callo 


3 int c time; 

4 int Cc arg; 

5 int (*c func)(); 
6 } callout[NCALL] ; 





代码 清单 5-6 NCALL (param.h) 


1 #define NCALL 20 


4€ 5-15 callo 结构 体 





指向 定时 执行 的 函数 的 指针 


callo 结构 体 表示 ， 在 指定 时 间 Cc time) 后 执行 指定 函数 C func, 
并 将 c. arg 作为 参数 传 给 该 函数 。callout[] 的 元 素 按照 执行 顺序 排 
n 执行 过 的 元 素 Ccallo 结构 体 ) 将 从 callout[] 中 移 除 。callo 

结构 体 的 c time 不 是 以 绝对 时 间 的 形式 ， 而 是 以 距 前 一 个 callo 结构 
体 的 相对 时 间 的 形式 设 定 的 〈 图 5-7 ) 。 


c time c time c time c time c time 





T 





后 


图 5-7  callout[] 





timeout() 函数 用 来 指定 在 某 一 时 间 执 行 某 个 函数 。 它 癌 callout[] 
追加 元 素 并 使 其 按照 执行 顺序 排列 〈 表 5-16， 代 码 清单 5-7 ) 。 


K 5-16 timeout() 的 参数 





1 timeout(fun, arg, tim) 

2 { 

3 register struct callo *p1, *p2; 
4 register t; 

5 int s; 

6 

7 t = tim; 

8 s = PS->integ; 

9 p1 = &callout[6]; 
10 spl7(); 
11 while(pi1-»c func != 0 && p1-»c time«- t) ( 
12 t =- p1-»c time; 

13 pl++; 

14 } 

15 pl-»c time =- t; 

16 p2 = p1; 

17 while(p2-»c func != 0) 

18 p2++; 

19 while(p2 >= p1) { 

20 (p2+1)->c_time = p2->c_time; 
21 (p2+1)->c_func = p2->c_func; 
22 (p2+1)->c_arg = p2->c_arg; 
23 p2--; 

24 } 


25 pl-»c time = t; 


26 pl-»c func = fun; 


27 pi-»c arg = arg; 
28 PS-»integ - s; 
29 } 





10 将 处 理 器 优先 级 提升 至 7 防止 发 生 时 钟 中 断 。 因 为 时 钟 中 断 处 
理 函 数 的 内 部 也 会 操作 callout[]， 为 了 避免 与 timeout 下 面 的 
处 理发 生 冲 突 ， 进 行 了 上 述 处 理 。 


11714 从 callout[] 的 起 始 位 置 般 历数 组 ， 跳 过 那些 执行 时 间 早 





于 参数 指定 时 间 的 元 素 ， 同 时 用 参数 指定 的 时 间 减 去 
callo.c _ time， 得 到 距 前 一 元 素 的 相对 时 间 。 


15 调整 排 在 奶 加 元 素 之 后 的 元 素 的 相对 时 间 。 
16~18 ”将 指针 移动 至 最 终 有 效 元 素 之 后 的 位 置 。 
19~24 将 排 在 奶 加 元 系 之 后 的 元 系 问 后 依次 移动 一 个 位 置 。 








25-27 追加 一 个 元 素 。 

28 恢复 处 理 器 优先 级 。 

系统 调用 sleep 

系统 调用 sleep 使 执行 进程 进入 睡眠 状态 直至 指定 时 间 。 到 达 指 定时 间 
后 通过 时 钟 中 断 处 理 函 数 唤醒 该 进程 。sslep() 为 系统 调用 sleep 的 
处 理 函 数 (X 5-17， 代 码 清单 5-8) 。 


K 5-17 系统 调用 sleep 的 参数 














BE TR] CEP) 








代码 清单 5-8 sslep() (ken/sys2.c) 


char *d[2]; 


sp17(); 

d[0] = time[0]; 

d[1] = time[1]; 
dpadd(d, u.u are[Re]); 


while(dpcmp(d[0], d[1], time[0], time[1]) > 6) ( 
if(dpcmp(tout[0], tout[1], time[0], time[1]) <= e || 
dpcmp(tout[0], tout[1], d[0], d[1]) > e) (1 
tout[0] = d[0e]; 
tout[1] = d[1]; 
} 
sleep(tout, PSLEP); 


} 
spl0(); 





时 间 处 理 

时 钟 中 断 处 理 函 数 以 1 秒 的 周期 递增 表示 时 间 的 变量 time. 

递增 CPU 时 间 

CPU 时 间 表 示 某 个 进程 占用 CPU 的 时 间 。 执 行进 程 的 proc.p_cpu 在 
发 生 时 钟 中 断 时 递增 。 用 户 模式 和 内 核 模式 下 占用 CPU 的 时 间 是 分 别 
进行 管理 的 ， 发 生 时 钟 中 断 时 ， 如 果 为 用 户 模式 则 递增 

user.u utime, WR KAKRA user.u stime. 

再 计算 执行 优先 级 

以 1 秒 为 周期 递增 全 部 进程 的 proc.p time. proc.p time 表示 该 进 
程 在 内 存 或 交换 空间 停留 的 时 间 ， 对 计算 执行 优先 级 有 很 大 的 影响 。 随 
后 执行 setpri() 重新 计算 进程 的 执行 优先 级 。 

尝试 对 进程 进行 再 调度 


如 果 内 存 或 交换 空间 中 刚刚 移入 的 进程 导致 交换 处 理 无 法 继续 进行 ， 则 
唤醒 调度 器 尝试 对 进程 进行 再 调度 。 




















言 号 处 理 

如 果 执 行进 程 为 用 户 进程 ， 并 且 已 接收 到 信号 ， 则 对 信号 进行 处 理 。 
lightning bolt 

时 钟 中 断 处 理 函 数 以 4 秒 为 周期 ， 将 proc.p wchan 设置 为 lbolt 变量 
EO 5-9 ) 的 地 址 ， 并 唤醒 入 睡 的 进程 。 此 处 理 被 称 为 lightning 


代码 清单 5-9 lbolt (system.h) 


1 int lbolt; 


对 于 不 存在 使 其 再 次 运行 的 事件 ， 并 且 竺 机 时 间 亦 不 明确 的 内 核 进 程 而 
言 ， 可 以 利用 lightning bolt 进行 短 时 间 的 睡眠 。 








clock() 


clock() 为 时 钟 中 断 处 理 函 数 〈 代 码 清单 5-100 。 执 行 权 转交 给 
clock() 时 ， 栈 的 状态 如 表 5-18 所 示 。 


K 5-18 执行 权 转 交 给 clock( 时 栈 的 状态 


CEN RN 


pc《〈 从 中 断 处 理 函 数 返 回 时 的 地 址 ) 









































被 中 断 的 进程 的 sp 





am 


PSW 
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被 中 断 的 进程 的 pc 


B 被 中 断 的 进程 的 PSW 


在 函数 的 起 始 位 置 首 先 执 行 csv。r5、I4、I3、fr2 WEA CR 5-19 
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S19. 在 dock0 内 执行 cov HUBS CURL dockQ 的 参数 的 对 应 
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旧 的 r5 











pc《〈 从 中 断 处 理 函数 返回 时 的 地 址 ) 





经 过 掩 码 的 PSW 
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被 中 断 的 进程 的 pc 








被 中 断 的 进程 的 PSW 
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传递 给 中 断 处 理 函 数 的 参数 为 通过 call. trap 处 理 压 入 栈 的 值 ， 距 离 
RRP r5 所 在 位 置 两 个 字 长 《dev 至 ps) 。 


代码 清单 5-10 clock() (ken/clock.c) 




















1 clock(dev, sp, r1, nps, r0, pc, ps) 
2 { 

3 register struct callo *p1, *p2; 
4 register struct proc *pp; 

5 

6 /* 对 时 钟 设备 的 寄存 器 进行 再 设 定 */ 
7 *]ks = 0115; 

8 

9 display(); 
10 
11 /* callout 处 理 */ 
12 if(callout[0].c func == 6) 
13 goto out; 
14 p2 = &callout[0]; 
15 while(p2->c_time<=0 && p2-»c func!-0) 
16 p2++; 
17 p2->c_time--; 
18 
19 if((ps&0340) !- 0) 
20 goto out; 
21 
22 spl5(); 


23 if(callout[0].c time <= 0) ( 


24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
70 
71 


out: 


p1 = &callout[0]; 
while(p1-»c func !- 0 && p1-»c time <= 0) { 
(*p1-»c func)(p1-»c arg); 
pl++; 
} 
p2 = &callout[0]; 
while(p2-»c func = p1->c func) { 
p2-»c time = pl->c_time; 
p2->c_arg = pi-»c arg; 
pl++; 
p2++; 


/* 递增 CPU 时 间 */ 
if((ps&UMODE) -- UMODE) ( 
u.u utimecr-; 
if(u.u prof[3]) 
incupc(pc, u.u prof); 





) else 
u.u stimecr-; 
pp = u.u procp; 
if(4-pp-»p cpu == 0) 
pp-»p cpu--; 


/* 以 1 秒 为 周期 的 处 理 */ 
if(++lbolt >= HZ) ( 
if((ps&0340) !- ©) 
return; 
lbolt =- HZ; 
/* 递增 时 间 */ 
if(++time[1] -- 6) 
-rtime[0]; 
spl1(); 
/* 唤醒 通过 系统 调用 sleep 进 入 睡眠 状态 的 进程 */ 
if(time[1]--tout[1] && time[6]==tout[6]) 
wakeup(tout); 
/* lightning bolt */ 
if((time[1]803) == ©) ( 
runrun++; 
wakeup(&lbolt); 

















} 
/* 递增 proc.p_time， 并 对 执行 优先 级 进行 再 计算 */ 
for(pp = &proc[0]; pp « &proc[NPROC]; pp++) 
if (pp-»p stat) ( 
if(pp-»p time !- 127) 
pp-»p 七 ime++; 




















72 if((pp-»p cpu & 0377) » SCHMAG) 






































73 pp-»p cpu -- SCHMAG; else 
74 pp-»p cpu = 6; 

75 if(pp-»p pri » PUSER) 
76 setpri(pp); 

77 } 

78 /* 尝试 对 进程 进行 再 次 调度 */ 
79 if(runin!-0) ( 

80 runin = 6; 

81 wakeup(&runin); 

82 } 

83 /* 信号 处 理 */ 

84 if((ps&UMODE) -- UMODE) ( 
85 u.u are = &r0; 

86 if(issig()) 

87 psig(); 

88 setpri(u.u procp); 

89 } 

90 } 

91 ) 





7 这 种 写法 可 以 正确 设置 KW11-L 和 KW11-P 两 种 时 钟 设备 的 寄 
有 


9 display() 在 PDP-11/40 的 环境 下 不 做 任何 处 理 。 





12~13 如果 callout[] 中 不 存在 需要 执行 的 元 素 ， 则 跳 转 到 


out. 


14-17 对 callout[] 中 未 到 执行 时 间 的 元 素 ， 递 减 其 中 首 个 元 素 
callo.c time。 因 为 callo.c time 为 距 前 一 个 元 素 的 相对 时 
人 EUIS 对 排 在 后 面 的 所 有 元 素 都 会 
产生 影响 。 


19-20 被 中 断 的 进程 的 处 理 器 优先 级 如 果 不 为 0， 就 不 处 理 
callout[]， 跳 转 到 out。? 





23~36 WR callout[] 中 存在 callo.c_time<=6 的 元 素 ， 那 么 
就 执行 该 元 素 的 c_func(c_arg)， 并 将 callo.c time»0 的 元 素 
DEDE ZAE 


40 UMODE 用 来 检查 PSW 是 合 被 设置 了 用 户 模 式 《 代 人 码 消 单 5- 
dra 



































“2 此 处 的 意图 是 若 处 理 器 优先 级 大 于 0， 意 味 着 有 更 紧急 的 事物 处 理 ， 则 延缓 调用 callout[] 






































计划 的 任务 。 一 一 审 校 者 注 





















































3 此 处 检查 UMODE 的 意图 是 : 若 先前 为 用 户 态 ， 且 启用 了 统计 直方 图 ， 则 要 更 新 统计 直方 图 。 




















但 





由 于 本 书 不 涉及 统计 直方 图 的 内 容 ， 请 忽略 这 部 分 。 一 一 审 校 者 注 


代码 清单 5-11 UMODE Cken/clock.c) 


1 #define UMODE 0170000 


51 递增 1bolt。 如 果 已 经 经 过 了 1 秒 以 上 的 时 间 ， 则 启动 以 1 秒 
为 周期 的 处 理 。 


52~53 ”如 果 被 中 断 的 进程 的 处 理 器 优先 级 不 为 0 则 返回 
54 从 lbolt 递减 相当 于 1 秒 的 值 。 


58 ”将 处 理 器 优先 级 设 定 为 1。 此 后 的 操作 需要 花费 一 些 时 间 ， 
此 可 以 适当 降低 处 理 器 优先 级 。 


63-66 ”进行 lightning bolt 处 理 。 以 4 秒 为 周期 唤醒 通过 lbolt 进 
入 睡 虐 状 态 的 进程 。 f m 变量 runrun， 表 示 存 在 执行 优先 级 
较 高 的 进程 ( 即 通过 lbolt 进入 睡眠 状态 的 进程 ) 。 


68-77 ”对 所 有 存在 的 进程 进行 下 述 处 理 。 递 增 proc.p_time， 最 
大 值 为 127。 调 整 proc.p cpu 使 其 最 大 值 小 于 SCHMAG〔 代 码 清 
单 5-12) 。 如 果 执 行 优 先 级 小 于 或 等 于 基准 值 PUSER《〈 代 码 清单 5- 
13) ， 将 再 次 计算 执行 优先 级 。 





代码 清单 5-12 SCHMAG Cken/clock.c) 


1 #define SCHMAG 10 


代码 清单 5-13 PUSER (param.h) 


1 #define PUSER 100 


85 为 了 让 信号 处 理 函 数 能 够 访问 被 中 断 的 进程 的 寄存 右 ， 将 
u.u ar0 设 定 为 保存 于 栈 中 的 re 的 地 址 。 


5.5 陷入 处 理 函 数 


陷入 处 理 函 数 根据 陷入 的 种 类 进行 相应 的 处 理 。 很 多 情况 下 通过 问 目 己 
发 送信 号 ， 将 其 后 的 处 理 委托 给 信号 处 理 函 数 。 








trap() 


trap() 为 一 般 情 况 下 的 陷入 处 理 函 数 〈 代 码 清 单 5-14 ) o 5 clock() 
相同 ， 将 通过 call M trap 保存 在 栈 中 的 值 作为 参数 CR 5-20 ) 。 


表 5-20 在 trap(0) 内 执行 csv 后 栈 的 状态 ， 以 及 fltrap(0) 的 参数 的 对 应 
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FP 断 的 进程 的 PSW 








代码 清单 5-14 trap() (ken/trap.c) 





1 trap(dev, sp, r1, nps, r9, pc, ps) 

2 { 

3 register i, a; 

4 register struct sysent *callp; 

5 

6 savfp(); 

7 if ((ps&UMODE) == UMODE) 

8 dev =| USER; 

9 u.u_arð = &r0; 

10 

11 switch(dev) { 

12 

13 default: 

14 printf("ka6 = %o\n", *ka6); 
15 printf("aps = %o\n", &ps); 
16 printf("trap type %o\n", dev); 
17 panic("trap"); 
18 
19 case O4«USER: /* bus error */ 
20 i - SIGBUS; 
21 break; 
22 
23 case 1«USER: /* illegal instruction */ 
24 if(fuiword(pc-2) == SETD && u.u signal[SIGINS] -- 0) 
25 goto out; 
26 i - SIGINS; 
27 break; 
28 


29 case 24USER: /* bpt or trace */ 


30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
77 


i = SIGTRC; 
break; 


case 34USER: /* iot */ 
i - SIGIOT; 
break; 


Case 54USER: /* emt */ 
i = SIGEMT; 
break; 


case 64USER: /* sys call */ 
u.u error - 0; 
ps =& -EBIT; 
callp = &sysent[fuiword(pc-2)8077]; 


if (callp == sysent) ( /* indirect */ 


a - fuiword(pc); 
pc =+ 2; 
i = fuword(a); 
if ((i & ~077) != SYS) 

i = 077; /* illegal */ 
callp = &sysent[i&077]; 
for(i-0; i«callp-»count; i++) 


u.u arg[i] = fuword(a =+ 2); 


) else { 


for(i-0; i«callp-»count; i++) { 


u.u arg[i] = fuiword(pc); 
pc =+ 2; 
} 
} 
u.u dirp = u.u_arg[8]; 
trap1(callp->call); 
if(u.u intflg) 
u.Uu error = EINTR; 
if(u.u error < 100) { 
if(u.u error) { 
ps -| EBIT; 
rð = u.u error; 


} 

goto out; 
} 
i = SIGSYS; 
break; 


case 8: /* floating exception */ 
psignal(u.u_procp, SIGFPT); 
return; 


78 case 8+USER : 


79 i = SIGFPT; 

80 break; 

81 

82 case 94USER: /* segmentation exception */ 
83 a = sp; 

84 if(backup(u.u ar0) == 0) 
85 if(grow(a)) 

86 goto out; 

87 i = SIGSEG; 

88 break; 

89 } 

90 

91 psignal(u.u procp, i); 

92 

93 out: 

94 if(issig()) 

95 psig(); 

96 setpri(u.u procp); 

97 ) 





6 savfp() Œ PDP-11/40 的 环境 下 不 做 任何 处 理 。 


7-8 ”如 果 触 发 陷入 的 进程 为 用 户 进 程 ， 则 设置 dev 的 USER 标志 
位 (= 第 4 比特 位 ， 代 码 清 单 5-15) 。 此 后 的 处 理 通过 此 标志 位 来 
判断 触发 陷入 的 进程 为 用 户 进程 还 是 内 存 进 程 。 


代码 清单 5-15 UMODE 和 USER (ken/trap.c) 





1 #define UMODE 0170000 
2 itdefine USER 020 


9 将 u.u_ are 设 定 为 保存 于 栈 中 的 re 的 地 址 。 通 过 
u.u_are[Rn] 可 以 访问 触发 陷入 的 进程 的 r0~r7， 以 及 PSW。 请 注 
意 ， 保 存 于 栈 中 的 值 最 终 将 会 恢复 至 用 户 进程 。Rn 在 reg.h 中 被 
定义 (代码 清单 5-16) 。 


代码 清单 5-16 Rn (reg.h) 





1 #define RO (0) 
2 #define R1 (-2) 


3 #define R2 (-9) 
4 itdefine R3 (-8) 
5 #define R4 (-7) 
6 #define R5 (-6) 
7 #define R6 (-3) 
8 ttdefine R7 (1) 

9 #define RPS (2) 





可 以 看 出 Rn 的 值 与 保存 于 栈 中 的 re 的 相对 位 置 保持 一 致 〈《 表 5-21 
Fg 


K 5-21 在 trap0 内 执行 csv 后 栈 的 状态 

















pc《〈 从 陷入 处 理 函 回 时 的 地 址 》 








经 过 掩 码 的 PSW 


被 中 断 的 进程 的 sp 
€ 1 








PSW -1 
DR —— 
dp —R—— 
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E 被 中 断 的 进程 的 PSW 


11 dev 的 值 为 陷入 种 类 。 根 据 dev 进行 相应 的 处 理 。 


13417. 在 内 核 进程 内 发 生 陷 入 时 的 处 理 。trap() 基本 没有 考虑 过 
要 如 何 处 理 这 种 情况 ， 通 常 是 将 nofault 指向 陷入 处 理 函 数 ， 由 
该 函数 进行 后 续 处 理 。 因 此 ， 此 处 在 输出 内 核 PAR6、 被 陷入 中 断 
的 进程 的 PSW 和 dev《 陷 入 种 类 ) 之 后 ， 调 用 panic() 结束 处 
理 。 


19~21 case 语句 中 的 n+USER 表示 用 户 模式 的 陷入 。USER 标志 
位 在 第 8 行 被 设 定 。 如 果 是 总 线 错误 ， 则 将 i 主 设 置 为 信号 种 类 并 退 
出 switch 语句 。 


23-27 发 生 错 误 指令 时 的 处 理 。 与 总 线 错 误 相 同 ， 将 i 设置 为 信 
号 种 类 并 退出 switch 文 。 如 果 引 发 错误 指令 的 指令 ( 即 
fuiword(pc-2). pc 指向 触发 陷入 的 指令 的 下 一 个 指令 ) 为 
SETD， 但 同时 却 并 没有 设 定 错误 指令 的 信和 号 

(u.u signal[SIGINS]) 时 ， 则 忽略 此 陷入 。SETD 为 C 编译 器 
插入 到 所 有 程序 起 始 位 置 的 指令 (代码 清单 5-17) 


代码 清单 5-17 SETD (ken/trap.o) 








1 #define SETD 0170011 


2939 发生 错误 指令 、 断 点 /跟踪 、iot、emt 时 ， 执 行 与 发 生 总 线 
错误 时 相同 的 处 理 。 


41-72 发 生 系 统 调用 时 的 处 理 ， 下 文 会 对 此 做 详细 说 明 。 


74-76 “内核 进程 触发 浮动 小 数 点 异常 时 的 处 理 。 发 送信 号 后 随即 
返回 。 内 核 进程 本 身 不 进行 浮动 小 数 点 运算 。 在 内 核 进程 中 发 生 了 
浮动 小 数 点 异常 ， 则 表示 由 用 户 程序 执行 的 浮动 小 数 点 运算 在 执行 
系统 调用 ， 并 切换 到 内 核 进 程 后 触发 了 陷入 。 因 为 PDP-11/40 似乎 
无 法 在 正确 位 置 触 发 浮动 小 数 点 运算 的 异常 ， 所 以 会 导致 这 种 现 
象 的 发 生 (图 5-8) 。 


用 户 模 式 


el 
X 
AU 
HL 


浮动 小 数 点 运算 -- 





图 5-8 ”和 内核 进程 中 发 生 浮动 小 数 点 的 异 锦 
78-80 用户 进程 触发 浮动 小 数 点 异常 时 的 处 理 。 与 总 线 错误 相 
同 ， 将 i 设置 为 陷入 种 类 并 退出 switch 语句 。 


82-88 ”用户 进程 触发 段 异 常 时 的 处 理 。 由 于 并 种 的 原因 有 可 能 是 
栈 区 域 溢 出 ， 因 此 首先 执行 backup() 恢复 触发 陷入 前 的 状态 ， 再 
0 e cU 
动 扩展 。 


91 退出 switch 语句 后 的 处 理 。 执 行 psignal() 回执 行进 程 发 
送信 和 号。 


94~95 ”如 果 收 到 信号 ， 则 进行 信号 处 理 。 此 前 通过 psignal() 发 
送 的 信号 在 此 处 立即 得 到 处 理 。 


96 执行 setpri()， 再 次 计算 进程 的 执行 优先 级 。 











grow() 


grow() 用 来 扩展 用 户 进程 栈 区 域 的 长 度 〈 表 5-22， 代 码 清单 5-18 ) 。 
参数 为 位 于 用 户 空 间 中 的 新 的 栈 区 域 的 上 限 地 址 。 将 此 地 址 再 加 上 
20x64 字 节 即 是 新 的 栈 区 域 的 长 度 。 如 果 此 地 址 已 在 当前 栈 区 域 的 范围 
之 内 ， 则 不 做 任何 处 理 (图 5-9 ) 。 


用 户 空 间 





图 5-9 grow() 
表 5-22 grow() 的 参数 





sp 新 的 栈 区 域 的 地 址 





register a, si, i; 


if(sp >= -u.u ssize*64) 

return(0); 
si = ldiv(-sp, 64) - u.u ssize + SINCR; 
if(si <= 0) 

return(0); 


if(estabur(u.u tsize, u.u dsize, u.u ssize*si, u.u sep)) 
return(0); 

expand(u.u procp-»p size-si); 

a = u.u procp-»p addr + u.u procp-»p size; 

for(i-u.u ssize; i; i--) { 
a--; 
copyseg(a-si, a); 


for(i-si; i; i--) 
clearseg(--a); 

u.Uu Ssize =+ si; 

return(1); 





6-7 ”如 果 栈 区 域 己 经 足够 大 ， 则 不 做 任何 处 理 并 返回 。 请 注意 ， 
由 于 栈 区 域 的 地 址 从 0xffff 开始 ， 因 此 为 负 值 。 


8~10 ”计算 栈 需要 扩展 的 长 度 ， 并 检查 是 否 为 正 值 ， 如 果 不 是 则 返 
回 ， 且 不 做 扩展 处 理 。SINCR 被 定义 为 20 (代码 清单 5-19) 。 


代码 清单 5-19 SINCR (param.h) 


1 #define SINCR 20 


11712 执行 estabur() 更 新 用 户 APR。 


13 执行 expand() 扩展 数据 段 。 
14-20 ”移动 栈 区 域 ， 移 动 的 距离 为 对 数据 段 进行 扩展 的 长 度 。 
21~22 更 新 栈 区 域 的 长 度 ， 返 回 1 表示 扩展 成 功 。 








5.6 系统 调用 的 处 理 流程 
传递 参数 的 方法 


如 前 所 述 ， 癌 系统 调用 传递 参数 的 方法 ， 因 系统 调用 的 种 类 而 异 。 基 本 
上 是 通过 Fe， 或 者 是 通过 在 trap 指令 (sys 指令 及 其 参数 ) 之 后 指定 
的 地 址 向 系统 调用 传递 参数 代码 清单 5-20 ) 。 在 系统 调用 处 理 函 数 
内 部 ， 对 前 者 通过 u.u_are[]、 对 后 者 通过 u.u_arg[] 访问 。 此 外 也 
存在 两 种 方式 并 用 的 情况 。 


代码 清单 5-20 系统 调用 执行 的 示例 





1 mov $1, re 
2 sys sys number1 / 通过 re 传递 参数 





1 sys sys number2 / 在 sys 指 令 的 后 面 指定 参数 




















2 arg 





系统 调用 也 文 持 间接 执行 的 方式 。 编 号 为 0 的 系统 调用 用 来 间接 执行 其 
他 系统 调用 。 在 sys 指令 及 其 参数 (=0 ) 后 面 指定 数据 区 域 的 地 址 ， 
该 地 址 指向 实际 执行 系统 调用 的 指令 代码 清单 5-21 ) 。 


代码 清单 5-21 系统 调用 间接 执行 的 示例 





1 .text 
2 Sys 0; sys call 
3 .data 


4 sys call: 
5 Sys sys number; sys arg 





sysent 结构 体 


sysent 结构 体 保 存 与 系统 调用 处 理 函 数 相 关 的 数据 《代码 清单 5-22， 
rM 。 具 体 来 说 ， 就 是 保存 着 参数 的 数量 ， 和 系统 调用 处理 函数 
地址 。 


代码 清单 5-22 sysent (ken/trap.c) 


1 struct sysent 1 
2 int count; 


3 int (*call)(); 
4 ) sysent[64]; 





K 5-23 sysent 结构 体 


eme feamann 


内 核 提供 的 系统 调用 ， 和 与 之 对 应 的 系统 调用 处 理 函 数 ， 都 是 由 
sysent[] 进行 管理 (代码 清单 5-23 ) 。sys 指令 的 参数 对 应 
sysent[] 的 下 标 。 























代码 清单 5-23 sysent[] (ken/sysent.c) 





1 int sysent[] 

2 { 

3 0, &nullsys, /* 0 = indir */ 
4 0, &rexit, /* 1- exit */ 

5 0, &fork, /* 2 = fork */ 

6 2, &read, /* 3= read */ 

7 2, &write, /* 4 = write */ 
8 2, &open, /* 5 = open */ 

9 0, &close, /* 6 = close */ 
10 0, &wait, /* 7 = wait */ 

11 2, &creat, /* 8 = creat */ 
12 2, &link, /* 9 = link */ 


13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 


v ` i i i ` ` v ` v i i ` ` v ` ` i i ` v ` v ` v ` ` i i i i v i i i i i i ` v v v ` i i be v 


OOo ooo ocoLIcococoBsmnmococcoccoccocomococcoccommnPmnbamnpbauaccomPudgnm..&*nmÍPKs.gugGmpn.£.m: 


v 


&unlink, 
&exec, 
&chdir, 
&gtime, 
&mknod, 
&chmod, 
&chown, 
&sbreak, 
&stat, 
&seek, 
&getpid, 
&smount, 
&sumount, 
&setuid, 
&getuid, 
&stime, 
&ptrace, 
&nosys, 
&fstat, 
&nosys, 
&nullsys, 
&stty, 
&gtty, 
&nosys, 
&nice, 
&sslep, 
&sync, 
&kill, 
&getswit, 
&nosys, 
&nosys, 
&dup, 
&pipe, 
&times, 
&profil, 
&nosys, 
&setgid, 
&getgid, 
&ssig, 
&nosys, 
&nosys, 
&nosys, 
&nosys, 
&nosys, 
&nosys, 
&nosys, 
&nosys, 
&nosys, 


10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 


unlink */ 
exec */ 
chdir */ 
time */ 
mknod */ 
chmod */ 
chown */ 
break */ 
stat */ 
seek */ 
getpid */ 
mount */ 
umount */ 
setuid */ 
getuid */ 
stime */ 
ptrace */ 
x */ 
fstat */ 
x */ 


smdate; inoperative */ 


stty */ 
gtty */ 

x */ 

nice */ 
sleep */ 
sync */ 
kill */ 
switch */ 
x */ 

x */ 

dup */ 
pipe */ 
times */ 
prof */ 
tiu */ 
setgid */ 
getgid */ 
sig */ 

x */ 

17 

*/ 

TE 


xX X XK x x xx x 


61 0, &nosys, /* 58-2 x */ 
62 0, &nosys, /*59-2-x */ 
63 0, &nosys, /*60-2x */ 
64 0, &nosys, /*61-2x*/ 
65 0, &nosys, /*62-2x */ 
66 0, &nosys /* 63 = x */ 
67 }; 








nullsys() 是 不 做 任何 处 理 的 函数 ， 被 赋予 用 于 间接 执行 的 
sysent[86]， 实 际 上 不 会 被 任何 人 调用 代码 清单 5-24 ) 。 执 行 
RE 后 将 触发 错误 ， 会 被 赋予 还 未 使 用 的 sysent[] WR RB 
清单 5-25 ) 。 


代码 清单 5-24 nullsys() Ctrap.c) 


ullsys() 


n 
{ 
} 





代码 清单 5-25 nosys() Ctrap.c) 


1 nosys() 

2 { 

3 u.u_error = 100; 
4} 





trap() 


po A ft trap() 中 进行 的 处 理 如 下 所 示 〔( 代 码 清 
单 5-26 ) 。 


代码 清单 5-26 trapO 中 的 相应 处 理 Ctrap.c) 





41 case 6+USER: /* sys call */ 

42 u.u error - 0; 

43 ps =& -EBIT; 

44 callp = &sysent[fuiword(pc-2)8077]; 
45 if (callp == sysent) ( /* indirect */ 


46 a = fuiword(pc); 


47 pc =+ 2; 


48 i = fuword(a); 

49 if ((i & ~077) != SYS) 

50 i = 077; /* illegal */ 
51 callp = &sysent[i&077]; 

52 for(i-0; i«callp-»count; i++) 
53 u.u arg[i] = fuword(a =+ 2); 
54 ) else { 

55 for(i-0; i«callp-»count; i++) { 
56 u.u arg[i] = fuiword(pc); 
57 pc =+ 2; 

58 } 

59 } 

60 u.u dirp = u.u arg[9]; 

61 trapl(callp-»call); 

62 if(u.u intflg) 

63 u.Uu error = EINTR; 

64 if(u.u error < 100) { 

65 if(u.u error) { 

66 ps =| EBIT; 

67 rð = u.u error; 

68 } 

69 goto out; 

70 

71 i = SIGSYS; 

72 break; 





41 发 生 系统 调用 时 的 处 理 。 


42 Hif u.u error. 


43 重 置 触发 陷入 的 进程 的 PSW[0]。EBIT 的 值 为 1〈 代 码 清单 5- 
27) 。 


代码 清单 5-27 EBIT (ken/trap.c) 
1 #define EBIT 1 
44 fuiword(pc-2) 表示 触发 陷入 的 指令 (=trap 指令 ) 。trap 
指令 低位 6 比特 的 数字 代表 系统 调用 的 种 类 。 
45 间接 系统 调用 时 的 处 理 。 


46-50 XR trap 指令 的 下 一 个 地 址 中 存放 的 值 也 是 一 个 地 
址 ， 如 果 该 地 址 指 问 的 数据 不 是 trap 指令 ， 则 将 i 设 定 为 
077 (nosys) . SYS 表示 trap 指令 (代码 清单 5-28) 。 

代码 清单 5-28 SYS (ken/trap.c) 


1 #define SYS 0104400 


51 将 callp 设置 为 实际 执行 的 sysent[] 的 元 素 。 


52~53 将 u.u_arg[i] 赋予 位 于 trap 指令 后 方 传递 给 系统 调用 
的 参数 。 


54 直接 系统 调用 时 的 处 理 。 


将 u.u_arg[] 赋予 位 于 trap 指令 后 方 传递 给 系统 调用 的 


60 将 u.u dirp 赋予 位 于 trap 指令 后 方 传递 给 系统 调用 的 参数 
的 起 始 位 置 的 值 。u.u_dirp 用 于 在 系统 调用 处 理 函 数 内 部 取得 从 
用 户 程序 传递 过 来 的 文件 路 径 名 。 


61~63 trap1() 用 来 执行 系统 调用 处 理 函 数 〈 表 5-24， 代 码 清单 
5-29) 。 会 在 第 6 章 中 介绍 。 


K 5-24 trap10 的 参数 























里 函数 的 地 址 














代码 清单 5-29 trapl() (ken/trap.c) 


1 trapl(f) 
2 int (*f)(); 
3 { 


u.u intflg - 1; 
savu(u.u qsav); 
(*f)0; 

u.u intflg - 0; 


\D 00 0Uu1 人 上 





64 u.u error 不 为 EFAULT 时 的 处 理 。 未 发 生 错 误 时 这 里 的 if 
语句 的 值 为 真 。 如 果 u.u error 为 EFAULT， 与 发 生 总 线 错误 时 相 
同 ， 将 谋 设 置 为 陷入 种 类 并 退出 switch 语句 。 





65-68 WMR u.u_error 被 赋予 了 错误 代码 ， 则 将 触发 陷入 的 进程 
的 PSW[0] 设 为 1， 并 将 re 设 定 为 u.u_error 的 值 。 执 行 系统 调 
用 的 程序 可 以 通过 PSW[0] 判断 系统 调用 中 是 否 肥 生 了 错误 。 


69” 跳 转 至 out， 对 信号 进行 处 理 并 再 次 计算 进程 优先 级 ， 然 后 结 
束 系 统 调用 。 





5.7 ”小结 


。 由 于 某 种 原因 引发 中 断 和 陷入 后 ， 和 暂停 当前 处 理 ， 由 内 核 进 程 执 行 
相应 的 处 理 函 数 后 再 恢复 被 暂停 的 处 理 。 


。 中 断 是 对 周边 设备 提出 的 异步 中 断 请 求 进行 有 效 处 理 的 机 制 。 

。 陷入 是 对 CPU 内 部 发 生 的 异常 进行 有 效 处 理 的 机 制 。 

。 系统 调用 是 用 户 程 序 执行 内 核 功能 的 手段 ， 利 用 陷入 实现 。 

e 系统 调用 由 sysent[] 管理 。 通 过 sysent[0] 可 实现 间接 执行 。 











第 6 章 fuv 


61 什么 是 信和 号 

言 号 是 一 种 实现 进程 间 通 信 的 机 制 。 收 到 信号 的 进程 将 暂停 当前 执行 的 
内 容 ， 并 根据 信号 种 类 做 相应 的 处 理 。 根 据 信号 暂停 当前 处 理 ， 并 在 需 
要 时 恢复 的 特点 ， 可 视 为 中 断 的 一 种 。 

言 号 可 实现 以 下 功能 。 

。 剥 夺 用 户 进程 的 控制 权 

。 终 止 用 户 进程 的 运行 

。 跟踪 用 户 进程 的 处 理 (trace) 

当 进程 成 为 执行 进程 后 ， 会 检查 是 否 收 到 信号 ， 如 果 收 到 了 信号 则 调用 


信号 处 理 函 数 《〈 图 6-1 ) 。 进 程 也 可 以 选择 忽略 信号 ， 或 执行 独 目 定义 
的 信号 处 理 函数 。 











进程 1 进程 2 时 间 
1 
通过 系统 调用 signal 
设 定 user.u_signal[n] | 
AL 
^ 

i 

| 发 送信 号 

i 

i swtch() sleep) 





接收 信号 时 的 
检查 和 处 理 


图 6-1 信号 处 理 流程 
e BC PS 


用 户 进 程 执行 系统 调用 kill 后 ， 即 可 向 其 他 进程 发 送信 号 。 此 外 ， 也 
可 以 通过 终端 发 送信 和 号。 

对 于 收 到 信和 号 的 进程 ，proc.p_sig 会 被 设 为 代表 信号 种 类 的 数值 。 如 
果 处 理 信 和 号 前 又 接收 到 了 新 的 信和 号, 旧 的 信号 将 被 覆 凋 。 但 是 ， 用 于 强 
制 结束 的 SIGKIL 却 不 会 被 覆盖 。 


最 近 的 操作 系统 一 般 将 信号 作为 比特 向量 处 理 ， 因 此 即使 收 到 新 的 信号 
USE IHRE S o 


HARE m 


内 核 进程 会 在 下 述 处 理 中 确认 是 否 收 到 了 信和 号。 如 宁 收 到 ， 则 执行 信和 号 
AREE PKI ŽI o 


e proc.p pri 大 于 等 于 0， 并 准备 进入 休眠 状态 时 

e 时 钟 中 断 处 理 函数 以 每 秒 1 次 的 频率 确认 

e. 陷入 处 理 函 数 
执行 进程 之 外 的 进程 无 法 确认 是 否 收 到 了 信号 ， 也 就 是 说 ， 即 使 向 某 
个 进程 发 送 了 信号 ， 也 不 能 保证 对 方 会 立即 进行 处 理 。 只 有 当 该 进程 变 
ee 号 。 这 一 点 与 周边 设备 引发 的 中 断 相 比 有 很 大 

< 同 。 

言 写 的 种 类 


信号 具有 多 个 种 类 。 虽 然 现在 在 其 他 操作 系统 中 可 以 设 定 多 达 20 种 的 
信号 ， 但 是 UNIX V6 只 定义 了 13 种 (代码 清单 6-1， 表 6-1 ) 。 


代码 清单 6-1 信号 (param.h) 


























1 #define NSIG 20 


2 itdefine SIGHUP 1 

3 #define SIGINT 2 

4 #define SIGQIT 3 

5 #define SIGINS 4 

6 #define SIGTRC 5 

7 stdefine SIGIOT 6 

8 #define SIGEMT 7 

9 #define SIGFPT 8 
10 #define SIGKIL 9 
11 #define SIGBUS 10 
12 #define SIGSEG 11 
13 #define SIGSYS 12 
14 #define SIGPIPE 13 





K 6-1 信号 的 种 类 





seme o pee. T 
执行 输入 输出 陷入 指令 
执行 模拟 指令 


SIGKIL(9) 强制 结 














SIGBUS(10) 

















SIGSYS(12) 指定 了 错误 参数 


SIGPIPE(13) 终止 


通过 赋值 user.u_signal[n] (n 代表 信号 的 种 类 ) ， 可 选择 忽略 该 信 
号 ， 或 执行 独自 定义 的 信号 处 理 函 数 。user.u_signal[n] 的 值 与 收 到 
信号 后 进行 的 处 理 之 间 的 关系 如 表 6-2 所 示 。 


K 6-2 设 定 user.u signal[] 


使 进程 自我 终止 
































偶数 (信号 处 理 函 数 的 地 址 1) 使 进程 执行 指定 的 处 理 函数 


1 由 于 PDP-11/40 中 的 指令 以 字 为 单位 (偶数 字 节 单位 ) 对 齐 ， 因 此 函数 的 地 址 一 定 为 偶数 。 






























































但 是 ，n=9 的 SIGKIL 比较 特殊 。 进 程 无 法 忽略 SIGKIL 或 执行 独自 定 
义 的 处 理 函 数 。 收 到 SIGKIL 的 进程 必须 结束 自身 的 处 理 ， 
此 ，user.u_signal[9] 的 值 始 终 为 0。 


用 户 进程 通过 执行 系统 调用 signal 可 以 设 定 user.u signal[] 的 
值 。 


ssig() 


ssig() 为 系统 调用 signal 的 处 理 函 数 〈 表 6-3， 代 码 清单 6-2 . dA 
行 此 函数 将 改变 u.u_signal[] 的 值 。 


表 6-3 系统 调用 signal 的 参数 





代码 清单 6-2 ssig() (ken/sys4.c) 


sig() 


can 


register a; 


a = u.u arg[0]; 

if(a«-0 || a»«NSIG || a --SIGKIL) ( 
u.u error - EINVAL; 
return; 


o NOU i$ un.€nmnÓ| 


u.u are[Re] = u.u signal[a]; 

u.u signal[a] = u.u arg[1]; 

if(u.u procp-»p sig -- a) 
u.u procp-»p sig = 0; 





5^9 信号 的 种 类 小 于 等 于 0， 或 大 于 等 于 NSIG(20)， 或 等 于 
SIGKIL(9) 时 判断 为 出 错 。 


10 将 当前 u.u_signal[a] 的 值 保 存 于 用 户 进程 的 re， 此 数值 将 
成 为 系统 调用 signal 的 返回 值 。 


11 将 u.u signal[a] 设置 为 由 参数 指定 的 值 。 


12413 ”如 果 执 行 中 的 进程 在 此 之 前 已 经 收 到 了 与 刚刚 设 定 的 
u.u_signal[a] 相对 应 的 信号 ， 则 将 该 信号 清除 。 此 处 大 概 是 开 
发 者 认为 接收 信号 时 的 处 理 已 经 发 生 了 变化 ， 需 要 重 置 。 


kill() 


kill() 为 系统 调用 kill 的 处 理 函 数 CK 6-4， 代 码 清单 6-3 ) 。 通 过 
psignal() 向 用 户 程序 指定 的 进程 ID 相对 应 的 进程 发 送信 号 ， 但 是 无 
法 对 目 己 发 送信 号 。 此 外 ， 超 级 用 户 以 外 的 用 户 ， 如 果 发 送 与 接收 的 进 
程 不 具备 相同 的 实效 UID. (参见 第 9 章 ) ， 也 是 无 法 发 送信 号 的 。 

当 指 定 的 进程 ID 为 0 时 ， 回 与 执行 进程 位 于 同一 终端 、 除 procio] 和 
proc[1] 之 外 的 所 有 进程 发 送信 号 。 如 果 对 象 进程 不 存在 ， 则 会 引发 错 
误 。 虽 然 名 为 kill, 但 不 只 是 发 送 SIGKIL 那么 简单 。 


表 6-4 系统 调用 Kill 的 参数 














音 号 针对 的 进程 ID 。 如 果 r0 为 0， 则 对 象 包括 除 ID 为 0、1 的 进程 之 外 





的 所 有 进程 


参数 
re 
信号 的 种 类 


代码 清单 6-3 kill) (ken/sys4.c) 











1 kill() 

2 { 

3 register struct proc *p, *q; 

4 register a; 

5 int f; 

6 

7 f-209; 

8 a = u.u are[Re]; 

9 q = u.u procp; 
10 for(p = &proc[0]; p « &proc[NPROC]; p++) ( 


11 if(p == q) 
12 continue; 


13 if(a !- 0 && p-»p pid != a) 


14 continue; 

15 if(a == 0 && (p-»p ttyp !- q-»p ttyp || p <= &proc[1])) 
16 continue; 

17 if(u.u uid !- 0 && u.u uid !- p-»p uid) 
18 continue; 

19 fj 

20 psignal(p, u.u arg[0]); 

21 } 

22 if(f == 0) 

23 u.U error = ESRCH; 

24 ) 





signal() 
signal() 通过 执行 psignal()， 向 与 执行 进程 位 于 同一 终端 的 所 有 进 
程 发 送信 号 ( 表 6-5， 代 码 清单 6-4 ) 。signal() 由 终端 的 中 断 处 理 函 
数 运行 。 


K 6-5 signal() 的 参数 








代码 清单 6-4 signal() (ken/sig.c) 


ignal(tp, sig) 


register struct proc *p; 


for(p = &proc[0]; p < &proc[NPROC]; p++) 
if(p-»p ttyp -- tp) 
psignal(p, sig); 





psignal() 


psignal() 向 指定 的 进程 发 送信 号 〈 表 6-6， 代 码 清 单 6-5 . 1E 
是 ，SIGKIL 信号 不 会 被 禾 盖 。 


表 6-6 psignal() 的 参数 














1 psignal(p, sig) 
2 int *p; 


register *rp; 


if(sig »- NSIG) 
return; 


rp = p; 

if(rp->p_sig != SIGKIL) 
rp->p_sig = sig; 

if(rp->p_stat > PUSER) 
rp->p_stat = PUSER; 

if(rp->p_stat == SWAIT) 
setrun(rp); 





11-12 此 处 疑 为 Bug， 处 理 对 象 的 变量 不 应 为 proc.p_stat， 而 
应 是 proc.p_pri。 开 发 者 的 意图 应 该 是 使 执行 优先 级 保持 一 个 定 
值 ， 从 而 使 信号 更 容易 处 理 。 


13-14 ”如 果 对 象 进程 的 状态 为 SWAIT 并 处 于 睡眠 之 中 ， 将 其 唤醒 
并 促使 其 进行 信号 处 理 。SWAIT 在 进程 调用 sleep() 时 进入 睡眠 


状态 ， 且 proc.p pri 大 于 等 于 0 时 被 设 定 。 进 程 被 唤醒 并 通过 
xd 成 为 执行 进程 后 ， 在 sleep() 内 将 对 是 否 收 到 信号 进行 
HA o 


issig() 


issig() 用 来 确认 执行 进程 是 否 收 到 了 信号 〈 代 码 清单 6-6) 。 
当 user.u_signal[n] (n 表示 信号 的 种 类 ) 被 设 为 奇数 时 ， 忽 略 该 信 
E 





代码 清单 6-6 issig() (ken/sig.c) 


issig() 
{ 
register n; 
register struct proc *p; 


p = u.u_procp; 
if(n = p->p_sig) { 
if (p->p_flag&STRC) { 
stop(); 
if ((n = p-»p sig) == 0) 
return(0); 
j 
if((u.u signal[n]&1) -- 0) 
return(n); 


j 
return(0); 





7 收 到 信号 时 的 处 理 。 
8~12 与 跟踪 功能 相关 的 处 理 。 在 后 文中 将 对 其 进行 说 明 。 
13-14 ”如 果 u.u_signal[n] (n-proc.p sig) 的 值 为 偶数 ， 则 返回 


No 


16 ”如 果 没 有 收 到 信号 ， 或 是 需要 忽略 信号 时 返回 0。 





psig() 


psig() 进行 Pea TE h proc.p_sig 相对 应 的 信号 处 理 《〈 代 码 清单 
6-7) 。 当 内 核 进程 通过 issig() 进行 的 检查 结果 为 真 时 被 调用 。 


如 果 user.u signal[n] 的 值 为 偶数 ， 执 行 由 该 值 指 同 的 信号 处 理 也 
数 。 首 先 将 用 户 进程 的 PSW、pc 的 当前 值 压 入 用 户 进程 的 栈 的 顶部 ， 
并 将 栈 指针 指 辣 存放 pc 的 位 置 GE 6-7 ) 。 然 后 清除 用 户 进程 PSW 的 
陷入 位 CrapbiO ， 并 将 pc 设 设 定 为 信号 处 理 函数 的 地 址 。 信号 处 理 函 
数 在 控制 权 返 回 用 户 进程 后 被 执行 。 信号 处 理 函 数 由 rtt 或 rti 指令 
终止 。rtt 和 rti 指令 从 栈 顶 部 恢复 pc 和 PSW 的 值 ， 随 后 被 暂停 的 进 
程 将 继续 原 有 的 处 理 。 


表 6-7 用 户 栈 的 状态 











被 中 断 的 进程 的 pc 


被 中 断 的 进程 的 PSW 


被 中 断 的 进程 的 栈 的 项 间 











如 果 user.u signal[n] 的 值 为 0， 则 终止 进程 。 根 据 信号 的 种 类 可 以 
输出 调试 用 的 core 文件 。 最 后 将 用 户 进 程 的 re 的 值 、 信 和 号 的 种 类 、 是 
BÆRT core 文件 等 信息 作为 结束 状态 通知 父 进程 。 


代码 清单 6-7 psig() (ken/sig.c) 





register n, p; 
register *rp; 


rp = u.u procp; 

n = rp-»p sig; 

rp-»p sig = 6; 

if((pzu.u signal[n]) != Ə) { 
u.u error = 60; 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 


m 


11 if(n !- SIGINS && n !- SIGTRC) 


12 u.u signal[n] = 6; 
13 n = u.u are[Re] - 4; 

14 grow(n); 

15 suword(n*2, u.u are[RPS]); 
16 suword(n, u.u arO[R7]); 
17 u.u are[R6] = n; 

18 u.u are[RPS] =& -TBIT; 
19 u.u are[R7] = p; 

20 return; 

21 } 

22 switch(n) { 

23 

24 case SIGQIT: 

25 case SIGINS: 

26 case SIGTRC: 

27 case SIGIOT: 

28 case SIGEMT: 

29 case SIGFPT: 

30 case SIGBUS: 

31 case SIGSEG: 

32 case SIGSYS: 

33 u.u arg[0] = n; 

34 if(core()) 

35 n =+ 0200; 

36 

37 u.u arg[0] = (u.u are[Re]««8) | n; 
38 exit(); 

39 ) 





9 user.u signal[n] 被 设 定 为 独自 定义 的 信号 处 理 函 数 地 址 时 
的 处 理 。 


14 为 了 安全 起 见 ， 执 行 grow() 扩展 用 户 进程 的 栈 区 域 。 

22 u.u signal[n] 被 设 定 为 0 时 的 处 理 。 

35 如果 生成 了 core 文件 ， 则 将 n 的 第 7 比特 位 设置 为 1。 

37 将 u.u arg[0] 的 高 位 8 比特 设 定 为 用 户 进程 的 re 的 值 ， 低 











位 8 比特 设 定 为 表示 信号 种 类 以 及 是 否 生 成 了 core 文件 的 信 
Á. u.u arg[0] 作为 结束 状态 通知 父 进 程 。 


38 执行 exit()， 使 进程 结束 自 吴 的 处 理 。 
core() 


core() 在 当前 目录 下 生成 名 为 core 的 文件 (代码 清单 6-8 ) 。 文 件 包 
括 数据 段 的 全 部 内 容 (PPDA、 数 据 区 域 、 栈 区 域 ) 。 用 户 可 以 通过 检 
查 该 文件 调试 程序 。 


在 第 1 章 中 介绍 了 内 存 也 可 以 被 称 为 Core。 此 处 的 core() 进行 的 处 理 
通常 被 称 作 内 核 转 储 CCore Dump) 。 


代码 清单 6-8 core() (ken/sig.c) 





1 core() 

2 

3 register s, *ip; 

4 extern schar; 

5 

6 u.u error = 0; 

7 u.u dirp = "core"; 

8 ip = namei(&schar, 1); 

9 if(ip -- NULL) { 
10 if(u.u error) 
11 return(0); 
12 ip = maknode(0666); 
13 if(ip -- NULL) 
14 return(0); 
15 } 
16 if(laccess(ip, IWRITE) && 
17 (ip-»i mode&IFMT) -- 0 && 
18 u.u uid -- u.u ruid) ( 
19 itrunc(ip); 
20 u.u offset[0] = €; 
21 u.u offset[1] = 6€; 
22 u.u base = &u; 
23 u.u count = USIZE*64; 
24 u.u segflg - 1; 
25 writei(ip); 
26 S - U.U procp-»p size - USIZE; 
27 estabur(0, s, 0, 0); 
28 u.u base = 6; 
29 u.u count = s*64; 

30 u.u segflg = 0; 


31 writei(ip); 


32 } 

33 iput(ip); 

34 return(u.u error--0); 
35 ) 





在 系统 调用 处 理 中 处 理 信 号 

UNIX V6 在 系统 调用 处 理 中 如 果 处 理 了 信和 号， 将 引发 EINTR 错误 。 此 
时 将 恢复 接收 信号 时 的 进程 状态 ， 用 户 根据 需要 可 以 再 次 执行 系统 调 
用 有 


实际 执行 系统 调用 处 理 函 数 的 trap1() 的 代码 如 下 所 示 代码 清单 6-9 
E 








代码 清单 6-9 trap1() 中 的 相关 代码 Cken/trap.c) 


trap1(f) 
int (*f)(); 
{ 


1 

2 

3 

4 

5 u.u_intflg = 1; 
6 savu(u.u qsav); 
7 (C f)05 

8 u.u intflg = 0; 
9 


} 





trap1() 首先 设 定 u.u_intflg， 在 u.u qsav 中 保存 r5、r6 的 当前 
值 ， 然 后 执行 通过 参数 取得 的 系统 调用 处 理 函 数 。 执 行 完 毕 后 重 置 
u.u intf1lg 并 返回 。 


因为 u.u_intflg 被 重 置 ， 所 以 在 trap() 中 不 会 发 生 EINTR 错误 〈 代 
码 清单 6-10) 。 


代码 清单 6-10 trapO 中 的 相关 代码 Cken/trap.c) 


trapi(callp-»call); 
if(u.u intflg) 


u.Uu error = EINTR; 





因为 系统 调用 处 理 中 已 经 适度 提高 了 处 理 器 优先 级 ， 所 以 对 终端 的 输入 
不 会 引发 中 断 处 理 。 在 系统 调用 处 理 中 能 够 引发 信号 处 理 的 只 有 这 种 情 
况 ， 即 系统 调用 处 理 函 数 执行 sleep() 中 断 目 身 运行 后 ， 执 行进 程 切 
换 至 其 他 进程 ， 而 后 者 问 前 者 及 送 了 信和 号。 


通常 ， 在 读 取 文件 等 情况 下 会 将 执行 优先 级 设 为 负 值 并 进入 睡眠 状态 ， 
此 时 信号 将 被 忽略 。 而 例如 终端 处 理 等 对 处 理 速度 较 慢 的 设备 执行 系统 
调用 read. write 或 wait 时 ， 有 可 能 在 系统 调用 处 理 函 数 中 将 执行 优 
先 级 设 为 大 于 或 等 于 0 的 值 并 进入 睡眠 状态 。 只 有 在 这 种 情况 下 有 可 能 
发 生 对 信号 的 处 理 。 

收 到 信号 时 ， 会 在 sleep() 中 将 其 检 出 (代码 清单 6-11) . sleep() 
执行 aretu(u.u_qsav) 后 ， 将 从 trap1() 返回 处 继续 进行 处 理 。 此 时 
因为 u.u_intflg 未 被 重 置 ， 所 以 在 trap() 中 将 发 生 EINTR 错误 。 


代码 清单 6-11 sleep) 中 的 相关 代码 Cken/slp.c) 








1 sleep(chan, pri) 
2 { 
CH) 
if(pri >= 0) ( 
if(issig()) 
goto psig; 
CP) 
swtch(); 
if(issig()) 


goto psig; 
} else { 


(中 上 略 ) 


34 psig: 
35 aretu(u.u qsav); 





6.2. 跟踪 功能 

什么 是 跟踪 

当 子 进程 处 理 〈 由 断 点 陷入 触发 的 ) 信号 时 ， 跟 踊 功 能 提供 了 一 种 使 父 
进程 能 够 介入 子 进 程 处 理 的 机 制 。 通 过 系统 调用 ptrace， 可 以 操作 子 
进程 的 数据 。 跟 踩 功 能 通常 供 调 试 器 等 使 用 。 

ipc 结构 体 

ipc (inter process communication) 结构 体 是 供 跟踪 功能 使 用 的 全 局 结构 


体 〈 代 码 清单 6-12， 表 6-8 ) 。 父 进程 通过 执行 系统 调用 ptrace， 可 
以 将 对 子 进 程 的 请 求 保存 在 ipc 结构 体 中 。 





代码 清单 6-12 ipc 结构 体 (ken/sig.c) 





K 6-8 ipc 结构 体 

















用 于 排他 处 理 























父 进程 请 求 的 种 类 





ip data 传递 的 数据 


跟 踊 的 处 理 流程 


子 进程 执行 系统 调用 ptrace 设 定 STRC 标志 位 。STRC 标志 位 表明 当前 
进程 为 跟踪 对 象 进程 。 


如 果子 进程 在 设置 了 STRC 标志 位 的 情况 下 进行 信号 处 理 ， 则 会 进入 
SSTOP 状态 ， 控 制 权 会 转移 至 父 进 程 。SSTOP 状态 表明 当前 进程 正在 等 
待 父 进程 进行 介入 处 理 。 


在 系统 调用 wait 的 处 理 函 数 中 ， 如 果 父 进程 发 现 了 处 于 SSTOP 状态 的 
子 进 程 ， 会 将 子 进程 的 SWTED 标志 位 置 1。 


此 时 控制 权 会 暂时 交还 给 用 户 进程 。 父 进程 如 果 执 行 系统 调用 
ptrace， 将 清除 SWTED 标志 ， 并 可 以 把 对 子 进程 的 请 求 赋予 ipc 结构 
体 。 如 果 父 进程 没有 执行 ptrace， 而 是 再 次 执行 系统 调用 wait 并 试 
图 将 控制 权 交 给 子 进 程 ，SWTED 标志 将 保持 为 1 的 状态 ， 系 统 以 此 判断 
父 进程 无 意 介 入 子 进程 处 理 ， 因 此 将 结束 跟踪 处 理 。 


控制 权 转 交 给 子 进 程 后 ， 子 进程 根据 ipe 结构 体 的 值 进行 相应 处 理 。 子 
进程 或 是 等 待 父 进程 的 再 次 介入 ， 或 是 返回 一 般 处 理 。 


跟踪 处 理 的 流程 如 图 6-2 所 示 。 











父 进程 子 进程 


通过 系统 调用 ptrace 
设置 STRC 标 志 位 


一 般 处 理 return 1 


| 


issigÜ. stop() 
wait() 如 果 设 置 了 STRC 标 志 位 ， 那 
寻找 处 于 SSTOP 状态 一 一 么 子 进程 将 会 设置 为 SSTOP 
的 子 进程 ， 并 对 其 设置 状态 ， 并 唤醒 父 进程 
SWTED 标志 位 


i return O 


通过 系统 调用 ptrace 

清除 子 进程 的 SWTED 

标志 位 ， 并 把 对 子 进 

程 的 请 求 赋予 ipc 结 构 

体 ,进入 睡眠 状态 。 一。 — procxmtü 
根据 pc 结构 体 的 值 进行 相应 处 理 


系统 调用 wait 






图 6-2 跟踪 处 理 流程 图 


stop() 


stop() 将 进程 设置 为 SSTOP 状态 (代码 清单 6-14 0. 。 设 置 后 ， 进 程 在 
收 到 信号 ， 并 开始 对 其 进行 相应 处 理 时 将 通知 父 进 程 ， 父 进程 也 可 以 对 
子 进程 发 送 指令 。 

当 进 程 的 跟踪 标志 位 (STRC) 为 1 时 ，stop() 由 issig() 调用 (代码 
清单 6-13 ) . issig() 在 执行 stop() 后 ， 会 检查 是 否 设置 了 

proc.p sig 的 值 ， 如 果 未 设置 则 返回 0。 这 应 该 是 考虑 到 stop() 处 
理 中 信号 有 可 能 被 清除 而 采取 的 措施 。 








代码 清单 6-13 issig) 中 的 相关 代码 Cken/sig.c) 


if (p-»p flag&STRC) { 
stop(); 


if ((n = p-^»p sig) == 0) 
return(0); 





代码 清单 6-14 stop) 中 的 相关 代码 Cken/sig.c) 


top() 


can 


register struct proc *pp, *cp; 


loop: 
Cp = u.u procp; 
if(cp-»p ppid !- 1) 
for (pp = &proc[0]; pp « &proc[NPROC]; pp++) 
if (pp-»p pid -- cp-»p ppid) { 
wakeup(pp) ; 


co-4Jopg ui» unF€nmnD| 


cp-»p stat - SSTOP; 

swtch(); 

if ((cp-»p flag&STRC)--0 || procxmt()) 
return; 

goto loop; 





7-11 如果 父 进程 不 是 init 进程 ， 唤 醒 父 进程 并 将 执行 进程 设置 
为 SSTOP 状态 。 


12 执行 swtch() 切换 执行 进程 并 期 竺 能够 切换 至 父 进程 。 当 前 
HETER A BERARI AAT RETE, 必须 由 父 进程 将 其 设 定 为 SRUN 状 


13~15 ”当前 进程 再 次 成 为 执行 进程 时 的 处 理 。 如 果 跟 踪 处 理 已 结 
束 ， 或 是 procxmt() 的 处 理 结果 为 真 时 ， 执 行 return 并 返回 一 
般 处 理 。 否 则 将 继续 循环 ， 以 促使 父 进程 再 次 介入 子 进程 的 处 理 。 


17 和 进程 ， 或 父 进程 为 init 进程 时 则 认为 发 生 异 
w, HH exit() 终止 进程 。 


ptrace() 


ptrace() 是 系统 调用 ptrace 的 处 理 函 数 〈 表 6-9， 代 码 清单 6-15 





WA a 象 的 子 进程 发 出 指令 进行 处 理 。 父 进程 和 子 进程 通过 
ipo? 吉 构 体 通 EIEE 


子 进 程 也 可 以 利用 系统 调用 ptrace 将 自身 的 STRC 标志 位 设置 为 1。 
K 6-9 ptrace() 的 参数 


设 定 ipc.ip. data 的 值 


— ID 
WE ipc.ip. addr 的 值 


指令 的 种 类 。0 与 其 他 数字 的 含义 不 同 ， 表 示 子 进程 正 被 父 进程 跟踪 











代码 清单 6-15 ptrace() (ken/sig.c) 





1 

2 

3 register struct proc *p; 

4 

5 if (u.u arg[2] <= 0) { 

6 u.u procp-»p flag -| STRC; 
7 return; 

8 } 

9 for (p=proc; p < &proc[NPROC]; p++) 
10 if (p-»p stat--SSTOP 
11 && p-»p pid--u.u arg[0] 


12 && p-»p ppid--u.u procp-»p pid) 


13 goto found; 

14 u.U error = ESRCH; 

15 return; 

16 

17 found: 

18 while (ipc.ip lock) 

19 sleep(&ipc, IPCPRI); 
20 ipc.ip lock = p-»p pid; 

21 ipc.ip data = u.u are[Re]; 
22 ipc.ip addr = u.u arg[1] & ~61; 
23 ipc.ip req - u.u arg[2]; 
24 p-»p flag -& -SWTED; 

25 setrun(p); 

26 while (ipc.ip req > 0) 

27 sleep(&ipc, IPCPRI); 
28 u.u are[Re] = ipc.ip data; 
29 if (ipc.ip req « 0) 

30 u.u error - EIO; 

31 ipc.ip lock = 6; 

32 wakeup(&ipc); 

33 ) 








548 ”如果 表示 跟踪 指令 种 类 的 参数 小 于 或 等 于 0， 则 将 执行 进程 
的 跟踪 标志 位 STRC 置 1 并 返回 。 


9~15 寻找 满足 下 述 条 件 的 进程 ， 找 到 后 跳 转 到 found. 
e 处 于 SSTOP 状态 


e proc.p pid 与 系统 调用 ptrace 的 参数 值 相同 





。 执行 进程 的 子 进 程 


18-19 ”找到 跟 踊 对 象 进程 时 的 处 理 。 首 先 尝试 取 得 ipc 结构 体 的 
锁 ， 如 果 无 法 取得 则 进入 睡眠 状态 。 


20-24 如 果 成 功 取得 锁 ， 设 置 ipc 结构 体 的 参数 ， 并 解除 跟踪 对 
象 进程 的 SNTED 标志 位 。 


25 执行 setrun()， 设 定子 进程 的 状态 为 SRUN。 此 时 子 进程 的 
SSTOP 状态 被 解除 ， 成 为 可 执行 状态 。 





26-27 ”进入 睡眠 状态 直至 ipc.ip_req 小 于 或 等 于 0。 由 子 进 程 
执行 的 procxmt() 会 把 ipc.ip_req 设 为 0。 

28 当 procxmt() 由 子 进 程 执 行 完毕 ， 且 当前 进程 通过 swtch() 
被 选 为 执行 进程 后 ， 将 re 设 为 ipc.ip data， 并 将 其 作为 系统 调 
用 ptrace 的 返回 值 。 


29~30 ipc.ip req 的 值 小 于 0 时 按 出 错 处 理 。 如 果 procxmt() 
在 处 理 中 出 错 ， 会 将 ipc.ip_req 设置 为 小 于 0 的 值 。 


31-32 ”最 后 解除 ipc 结构 体 的 锁 ， 并 唤醒 正在 等 待 同一 把 锁 的 其 
他 进程 。 


procxmt() 

procxmt() 由 被 跟踪 的 子 进程 执行 (代码 清单 6-16 ) 。 根 据 由 父 进 程 
执行 的 系统 调用 ptrace 设 定 的 ipc 结构 体 进行 读 写 数据 等 处 理 〈 表 6- 
10 ) 。 


K 6-10 ipc.ip_req 














读 取 位 于 子 进程 地 址 空间 的 数据 














读 取 位 于 子 进程 地 址 空间 的 数据 。 只 有 当代 码 段 和 数据 段 分 别 由 不 同 的 
APR 进行 管理 时 才 被 使 用 ， 因 此 在 PDP-11/40 的 环境 下 未 被 使 用 


























向 子 进 程 地 址 空间 写 入 数据 











向 子 进 程 地 址 空间 写 入 数据 。 只 有 当代 码 段 和 数据 段 分 别 由 不 同 的 APR 
进行 管理 时 才 被 使 用 ， 因 此 在 PDP-11/40 的 环境 下 未 被 使 用 





























6 向 PPDA 写 入 数据 








1 procxmt() 

2 { 

3 register int i; 

4 register int *p; 

5 

6 if (ipc.ip_lock != u.u_procp->p_pid) 
7 return(0); 

8 i = ipc.ip req; 

9 ipc.ip req = 6; 
10 wakeup(&ipc); 
11 
12 switch (i) ( 
13 
14 case 1: 
15 if (fuibyte(ipc.ip addr) -- -1) 
16 goto error; 
17 ipc.ip data - fuiword(ipc.ip addr); 
18 break; 

19 

20 case 2: 

21 if (fubyte(ipc.ip addr) -- -1) 
22 goto error; 

23 ipc.ip data - fuword(ipc.ip addr); 
24 break; 

25 

26 case 3: 

27 i - ipc.ip addr; 

28 if (i«0 || i >= (USIZE««6)) 

29 goto error; 

30 ipc.ip data = u.inta[i»»1]; 

31 break; 

32 

33 case 4: 

34 if (suiword(ipc.ip addr, 0) < 0) 


35 goto error; 


36 suiword(ipc.ip addr, ipc.ip data); 


37 break; 

38 

39 case 5: 

40 if (suword(ipc.ip addr, 0) < 0) 
41 goto error; 

42 suword(ipc.ip addr, ipc.ip data); 
43 break; 

44 

45 case 6: 

46 p = &u.inta[ipc.ip addr»»1]; 

47 if (p >= u.u fsav && p < &u. 

u f sav [25]) 

48 goto ok; 

49 for (i20; i«9; i++) 

50 if (p == &u.u are[regloc[i]]) 
51 goto ok; 

52 goto error; 

53 ok: 

54 if (p == &u.u are[RPS]) ( 

55 ipc.ip data -| 0170000; 

56 ipc.ip data =& -0340; 

57 } 

58 *p = ipc.ip data; 

59 break; 

60 

61 case 7: 

62 u.u procp-»p sig - ipc.ip data; 
63 return(1); 

64 

65 case 8: 

66 exit(); 

67 

68 default: 

69 error: 

70 ipc.ip req = -1; 

71 } 

72 return(0); 

73 ) 





697 如果 锁 没 有 被 正确 取得 则 退出 处 理 。 此 处 期 符 锁 由 ptrace() 
取得 。 


9-10 重 置 ipc.ip_req， 并 唤醒 因 执 行 ptrace() 并 等 待 





procxmt() 执行 结束 而 处 于 睡眠 状态 的 进程 。 


12472 根据 由 父 进 程 设 定 的 ipc.ip_req 进行 各 种 处 理 。 如 果 
ipc.ip req 的 值 为 7， 则 向 子 进程 发 送信 号 并 返回 1， 然 后 继续 
子 进程 的 一 般 处 理 。 如 果 值 为 8， 则 执行 exit() 强制 终止 进程 的 
运行 。 如 果 为 其 他 值 则 返回 0， 再 次 促使 父 进程 介入 子 进 程 的 处 
H. 











wait() 
wait() 中 与 跟踪 相关 的 处 理 如 下 所 示 (代码 清单 6-17 ) 。 
代码 清单 6-17 wait) 中 的 相关 代码 (ken/sys1.c) 


if(p->p_stat == SSTOP) { 
if((p->p_flag&SWTED) == 0e) { 
p->p_flag =| SWTED; 
u.u are[Re] = p-»p pid; 
u.u are[R1] = (p-»p sig««8) | 0177; 
return; 


} 
p-»p flag =& ~(STRC|SWTED); 
setrun(p); 


} 





33-38 ”如 果 未 设置 SWTED 标志 位 ， 则 将 其 设置 为 1。 将 用 户 进程 
的 re 设置 为 子 进程 的 proc.p_pid， 将 r1 的 高 位 8 比特 设置 为 
proc.p_psig， 低 位 8 比特 设置 为 0177， 随 后 返回 。 同 时 可 以 期 
待 一 下 此 后 的 执行 进程 将 执行 系统 调用 ptrace. 


39-40 ”如 果 在 34 行 设 定 的 SWTED 标志 位 此 时 仍 为 1 ( 即 父 进程 没 
有 通过 执行 系统 调用 ptrace 介入 子 进 程 的 处 理 ， 再 次 执行 了 系统 
调用 wait) ， 表 明 父 进程 无 意 跟 踪 子 进程 的 处 理 ， 因 此 将 停止 跟 
Ex. MEER STRC 和 SWTED 标志 位 ， 使 子 进程 进入 可 执行 状态 。 





63 ”小 结 
。 信 号 是 一 种 实现 进程 间 通 信 的 机 制 。 


收 到 信号 的 进程 将 暂停 一 般 处 理 ， 根 据 信号 的 种 类 进行 相应 的 处 
理 。 因 此 可 以 认为 信号 属于 中 断 的 一 种 。 


与 周边 设备 发 生 的 中 断 不 同 ， 信 和 号 完全 是 由 软件 实现 的 。 
可 以 忽略 信号 ， 也 可 以 执行 独 目 定义 的 信号 处 理 函 数 。 
如 果 收 到 多 个 信号 ， 旧 的 信号 将 被 履 冲 《SIGKIL 除外 ) 。 


由 执行 进程 检查 自己 是 否 收 到 了 信号 。 因 此 ， 向 进程 发 送 的 信号 未 
必 会 立即 得 到 处 理 。 


跟踪 是 父 进 程 介入 子 进程 处 理 的 机 制 ， 主 要 供 调 试 莫 等 使 用 。 








第 IV 部 分 EX UO 系统 


块 设备 指 的 是 磁盘 等 可 以 处 理 大 量 数 据 的 设备 。 包 括 程序 在 内 的 数据 被 
保存 在 块 设备 中 ,并 于 执行 时 读 取 至 内 存 。 第 IV 部 分 主要 介绍 以 下 内 
。 内 核 如 何 提高 对 块 设备 的 访问 性 能 
。 块 设备 驱动 如 何 操作 块 设备 


通过 阅读 本 部 分 的 内 容 ,可 以 对 如 何 访 问 保存 于 外 部 设备 中 的 数据 有 比 
较 清 晰 的 理解 。 








第 7 章 块 设备 于 系统 


7.1 设备 的 基础 

设备 的 种 类 

UNIX V6 使 用 的 周边 设备 可 以 分 为 块 设备 和 字符 设备 两 类 ( 表 7-1 ) 。 
表 7-1 块 设备 和 字符 设备 的 比较 

















z | 块 (512 字 节 ) 


从 起 始 块 开始 依次 分 配 0、1、2 等 地 址 Bore 





只 能 从 队列 的 起 始 
可 以 根据 需要 访问 任意 块 〈 随 机 访问 ) 位 置 开 始 访问 数据 
(顺序 访问 ) 




















(一 般 而 言 〉 高 速 《一般 而 言 ) 低速 











适用 于 传输 大 量 数据 。 内 核 通过 使 用 缓冲 区 Cbuffer) TO | e rupe gg 
| 实现 缓存 (cache) 、 异 步 处 理 、 延 迟 写 入 等 功能 。 文 件 系 a OR ORE 
统 也 是 构筑 在 块 设备 之 上 的 


























例 | 磁盘 设备 、 磁 带 设备 行 打印 机 、 控 制 终 
端 





设备 驱动 


设备 驱动 是 操作 设备 的 程序 。 对 1 个 设备 或 相同 种 类 的 设备 ， 通 常 存 
在 与 其 对 应 的 1 个 设备 驱动 。 设 备 驱 动 由 设备 驱动 表 管 理 ， 需 要 操作 某 
设备 时 ， 设 备 驱动 表 中 相应 的 驱动 将 被 调用 。 管 理 块 设备 驱动 的 设备 驱 
n. bdevsw[ ]， 而 管理 字符 设备 驱动 的 设备 驱动 表 为 cdevsw[ ] 

(图 7-1)。 


关于 块 设备 驱 动 和 块 设备 驱动 表 的 详细 内 容 将 在 第 8 章 中 说 明 。 


内 核 







设备 驱动 










设备 驱动 


设备 驱动 


i 


设备 驱动 表 


存在 管理 块 设 备 驱 动 的 
bdevsw[] 和 管理 字符 
设备 驱动 的 cdevswl] 





图 7-1 设备 驱动 表 

类 别 和 设备 编写 

设备 通过 类 别 (dass) 和 长 度 为 16 比特 的 设备 编号 管理 。 类 别 用 来 区 
分 块 设备 和 字符 设备 。 设 备 编号 的 高 位 8 比特 为 大 (major) 编号 ， 低 
位 8 比特 为 小 (minor) 编写。 大 编写 表示 设备 种 类 ， 小 编写 则 分 配给 
各 个 设备 。 


类 别 决定 使 用 的 设 别 驱 动 表 ， 大 编写 决定 设备 驱动 表 中 应 使 用 的 设备 驱 
动 ， 小 编号 的 用 途 依 设备 而 寞 。 


特殊 文件 





为 了 使 用 茶 个 设备 ， 必 须 生 成 对 应 的 特殊 文件 。 系 统管 理 者 通过 执行 用 
户 程序 /etc/mknod 生成 特殊 文件 。 特 殊 文 件 包括 设备 类 别 和 设备 编号 


等 内 容 。 


特殊 文件 在 /dev 下 生成 ， 文 件 名 为 代表 该 设备 的 字符 串 和 小 编写 的 组 
合 。 例 如 ，/dev/rke。 


/etc/mknod 执行 成 功 后 ， 特 殊 文件 被 添加 至 指定 目录 ， 也 将 自动 生成 
对 应 的 inode (参见 第 9 章 ) 。 在 该 inode 内 会 设置 表示 设备 类 别 的 
标志 变量 ， 同 时 也 会 设置 inode.1i_ addr[0] 为 设备 编号 (图 7-2 ) 。 








i_addr[0]: 大 编号 、 小 编号 
i flag: 类 别 ( IFBLK 或 IFCHR ) 





图 7-2 特殊 文件 
如 果 对 此 特殊 文件 执行 open、read、write、close 系统 调用 ， 则 在 
的 处 理 函 数 内 部 将 调用 与 大 编号 对 应 的 设备 驱动 ， 来 操作 设 


从 用 户 的 角度 来 看 ， 操 作 一 般 文 件 与 操作 设备 具有 相同 的 处 理 界面 ， 
因此 在 进行 将 用 户 程序 的 输出 对 象 从 文件 变 为 行 打印 机 等 操作 时 ， 只 需 


fp = open( "/work/file" ) ; 
4 


fp = open( "/dev/xxx" ) ; 





7.0 块 设备 子 系 统 

访问 块 设备 的 处 理由 块 设备 子 系统 统一 进行 。 块 设备 子 系统 由 若干 函数 
构成 。 此 外 ， 对 块 设 备 进行 数据 读 写 时 使 用 的 缓冲 区 也 由 块 设 备 子 系统 
进行 管理 CÉ 7-32 。 


内 核 


块 缓冲 池 


v 


图 7-3 块 设备 子 系统 
缓冲 区 


块 设备 子 系统 通过 缓冲 区 与 块 设备 进行 数据 交换 。 绥 冲 区 由 设备 编号 和 
块 编号 命名 。 对 对 个 块 进 行 处 理 时 ， 首 先 检 查 是 否 存 在 所 需 的 缓冲 区 ， 
如 果 已 经 存在 则 使 用 该 缓冲 区 ， 如 果 尚 未 存在 则 从 未 分 配 的 缓冲 区 中 获 
取 新 的 缓冲 区 ， 对 其 命名 后 使 用 (图 7-4 ) 。 
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块 设备 A 
( 设备 编号 = devA ) 
















Hig B 
( 设备 编号 = devB ) 






图 7-4 块 设备 缓冲 区 


使 用 缓冲 区 的 目的 主要 有 两 个 。 首 先是 为 了 在 多 个 进程 同时 访问 同一 

个 块 时 保持 数据 的 一 致 性 。 通 过 使 用 缓冲 区 和 排他 处 理 可 以 实现 这 一 

要 求 。 其 次 ， 将 需要 经 常 进行 读 写 操作 的 块 的 拷贝 (缓存 ) 保存 在 内 

存 中 以 改善 性 能 。 绥 存 能 够 减少 对 块 设 备 的 访问 次 数 ， 由 于 块 设备 的 访 
问 速度 与 CPU 的 执行 速度 相 比 十 分 缓慢 ， 因 此 减少 访问 次 数 将 使 系统 
性 能 得 到 相应 提升 。 此 外 ， 还 采取 了 通过 将 需要 访问 的 数据 预先 读 取 至 
i du i SHEIU S TUM 
性 能 。 

绥 冲 区 由 buf 结构 体 的 数组 buf[ ] 管理 (代码 清单 7-2， 代 码 清单 7- 

3， 表 7-2 ) 。 通 过 将 b dev 设 定 为 设备 编号 、b_blkno 设 定 为 块 编号 
为 缓冲 区 命名 。 


代码 清单 7-2 buf[] (buf.h) 


struct buf 
1 


int b flags; 
struct buf *b forw; 
struct buf *b back; 
struct buf *av forw; 
struct buf *av back; 
int b dev; 

int b wcount; 
char *b addr; 

char *b xmem; 

char *b blkno; 
char b error; 

char *b resid; 

) buf[NBUF]; 


define B WRITE 
define B READ 

#define B_DONE 

#define B ERROR 
#define B_BUSY 

#define B_PHYS 

#define B_MAP 

#define B WANTED 20100 
#define B_RELOC 0200 
define B ASYNC 0400 
#define B DELWRI 01000 





代码 清单 7-3 NBUF (param.h) 


1 #define NBUF 15 


表 7-2 buf 结构 体 








志 变 量 ， 参 照 表 7-3 


指向 b-list 前 方 的 指针 





*b back | 指向 b-list 后 方 的 指针 


指向 av-list 前 方 的 指针 
指向 av-list 后 方 的 指名 
读 写 长 度 。 在 访问 设备 时 以 2 的 补 数 形 式 指定 







































































地 址 的 扩张 比特 。 用 于 保存 位 于 物理 地 址 第 16 比 特 之 后 的 数据 


表示 在 访问 设备 时 发 生 错 误 


RAW 输入 输出 。 保 存 因 错 误 而 无 法 传送 的 数据 的 长 度 〈 以 字 节 为 单 
立 ) 














表 7-3 缓冲 区 的 标志 


























上 理 。 与 未 设置 B_READ 时 的 含义 相同 





























理 。 未 被 设置 时 表示 进行 号 入 处 理 




















此 缓冲 区 拥有 最 新 的 数据 。 表 示 已 完成 与 设备 的 同步 〈 读 取 或 写 
B_DONE |^) ， 或 者 拥有 比 设备 更 新 的 数据 〈 写 入 ) 。 设 置 此 标志 时 ， 不 会 对 






































设备 进行 读 取 数 据 的 处 理 


发 生 错 误 
此 缓冲 区 处 于 使 用 中 的 状态 。 在 av-list 中 不 存在 
表示 处 于 RAW 输入 输出 的 状态 

未 在 PDP-11/40 环 境 中 使 用 






































此 缓冲 区 处 于 使 用 中 的 状态 。 第 三 者 正 等 待 该 缓冲 区 被 释放 


hamoc eet ] REX) 


p async ”| 进行 预先 读 取 ， 异 步 写 入 。 不 等 待 设备 处 理 结束 。 处 理 结束 后 ， 在 被 
E 调用 的 iodone0 中 对 B_BUSY 进 行 重 置 


B DELwni | 进行 延迟 写 入 。 并 非 立 刻 将 数据 写 入 设备 ， 而 是 在 通过 getblk0 对 缓冲 
- 区 进行 再 分 配 时 ， 或 是 在 bflush() 被 调用 时 将 数据 写 入 设备 





























































































































buf 结构 体 用 于 保存 缓冲 区 的 状态 等 管理 数据 。 块 设备 中 数据 的 拷贝 保 
存在 buffers[] 的 数组 元 素 中 ，buf.b_addr 则 指向 该 元 素 〈 代 码 清单 
7-4) 。buf.b addr 和 buffers[] 的 关联 通过 binit() XE (图 7-5 
2 


缓冲 区 的 
管理 信息 





数据 





图 7-5 buf 和 buffers 


代码 清单 7-4 buffers[] (dmr/bio.h) 


1 char buffers [NBUF ] [514] ; 


b-list 和 av-list 


buf[ ] 通过 b-list 和 av-list 的 双重 环形 队列 管理 (图 7-6 ) 。 
CET ELEC 
- 
LET Rud s 


T d s; 


uud 





B o EM COM EUM 


—— ——yp» b-list 
------ > av-list 


图 7-6  b-list 和 av-list 


b-list 用 来 管理 已 分 配给 各 块 设 备 的 缓冲 区 ， 通 过 buf.b_ forw 和 
buf.b back 构成 环形 队列 。 位 于 各 b-list 头 部 的 元 素 为 devtab 结构 
体 ， El Ddevsw[] Fi d tab imis CID T, E74 
) o devtab 结构 体 也 用 于 设备 处 理 队 列 ， 详 细 请 参照 第 8 章 。 


但 是 ， 对 尚未 分 配给 设备 CNODEV) 的 缓冲 区 而 言 ， 位 于 b-list 头 部 的 
元 素 为 bfreelist (代码 清单 7-6 ) 。 


av-list 用 来 管理 处 于 非 使 用 状态 CB, BUSY 以 外 ) 的 缓冲 区 ， 

buf.av forw 和 buf.av_back 构成 环形 队列 。 由 av-list 管 
将 被 重新 分 配 (给 其 他 设备 ) 。 与 尚未 分 配给 设备 的 b-list [相同 ， DEF 
av-list 头 部 的 元 素 为 bfreelist. Æ b-list 还 是 av-list， 当 队列 为 








空 时 ， 队 列 头 部 的 元 素 指 问 自 刁 。 
代码 清单 7-5  devtab 结构 体 (buf.h) 


struct devtab 
{ 


1 

2 

3 char d active; 

4 char d errcnt; 

5 struct buf *b forw; 
6 

7 

8 

9 


struct buf *b back; 

struct buf *d actf; 

struct buf *d actl; 
}; 





K 7-4 devtab 结构 体 

















"— 
指向 设备 处 理 队 列 的 头 部 
指向 设备 处 理 队 列 的 末尾 


代码 清单 7-6  bfreelist (buf.h) 


1 struct buf bfreelist; 


























RAW 输入 输出 


问 块 设备 传送 数据 时 可 以 不 通过 缓冲 区 ， 并 且 不 受 块 长 度 〈512 字 市 ) 
的 限制 ， 这 称 为 RAW (无 处 理 ) 输入 输出 ， 用 于 对 块 设备 的 数据 进行 
整体 备份 等 处 理 〈 图 7-7 ) 。 


一 般 情 况 下 ， 输 入 输出 功能 需要 通过 缓冲 区 与 虚拟 地 址 空间 交换 数据 ，。 
但 是 RAW 输入 输出 可 以 直接 传送 数据 ， 无 需 通 过 缓冲 区 。 


为 了 使 用 RAW 输入 输出 功能 ， 系 统管 理 者 需要 生成 专用 的 特殊 文件 。 
和 





虚拟 地 址 空间 缓冲 区 块 设备 





buffers[] 
一 般 输入 输出 MIR (512 字 节 ) 为 单位 ， 通 过 缓冲 区 与 
进程 的 内 存 空 间 交 换 数据 
虚拟 地 址 空间 块 设备 
RAW 输入 输出 交换 数据 时 无 需 通过 缓冲 区 ， 且 不 受 块 长 


E (512 字 节 ) 的 限制 
图 7-7 ”一般 输 入 输出 和 RAW 输入 输出 


7.3. 缓冲 区 的 初始 化 
binit() 


binit() 4XIZETPDCEETT WIR RA CERTE ER 7-7 ) 。 在 系统 启动 
时 由 main() 调用 ， 且 仅 调 用 一 次 。 


代码 清单 7-7 binit() ( dmr/bio.c) 


init() 


mca 0 


register struct buf *bp; 
register struct devtab *dp; 
register int i; 

struct bdevsw *bdp; 


bfreelist.b forw - bfreelist.b back - 
bfreelist.av forw = bfreelist.av back = &bfreelist; 
for (i20; i«NBUF; i++) { 
bp = &buf[i]; 
bp-»b dev = -1; 
bp-»b addr = buffers[i]; 
bp-»b back = &bfreelist; 
bp-»b forw - bfreelist.b forw; 
bfreelist.b forw-»b back - bp; 
bfreelist.b forw - bp; 
bp-»b flags - B BUSY; 
brelse(bp); 


ehe 
NH ÓBGUvUoo-OouibuNmHdí 


e he 
A Ww 


15 
16 
17 
18 


NNNEBE 
N H|P OW 


(bdp = bdevsw; bdp-»d open; bdp++) ( 
dp = bdp-»d tab; 
if(dp) ( 

dp-»b forw = dp; 

dp-»b back = dp; 


MON 
B ou 


} 


i++; 


NA NJ NO NO 
co - OY U1 


UJ N 
C O 


} 
nblkdev = i; 





12 b dev = -1 表示 此 缓冲 区 处 于 NODEV 状态 。 

21-29 ”对 赋予 bdevsw[] 的 devtab.d tab 进行 初始 化 处 理 。 将 

位 于 各 设备 b-list 头 部 的 devtab 结构 体 的 成 员 变 量 b forw 和 

b back TRIH EI Ef. 

30 将 nblkdev 设置 为 块 设备 (驱动 ) 的 数量 。 
binit() 对 buf[] fll buffers[] 进行 关联 ， 将 所 有 的 缓冲 区 追加 至 
av-list 和 处 于 NODEV 状态 的 b-list。 此 外 ， 统 计 位 于 bdevsw[ ] 中 的 设备 
驱动 的 数量 ， 将 其 设置 到 nblkdev 中 【代码 清单 7-8 ) 。 


代码 清单 7-8 nblkdev (conf.h) 


1 int nblkdev; 


clrbufO 
clrbuf() 将 缓冲 区 的 数据 清 0《〈 表 7-5， 代 码 清单 7-9 ) 。 
表 7-5 clrbuf0 的 参数 











1 clrbuf(bp) 
2 int *bp; 


register *p; 
register c; 


bp-»b addr; 
256; 


10 *p++ = 0; 
11 while (--c); 
12 } 





7.8 绥 冲 区 的 获取 和 释放 
getblk() 


getblk() 是 取得 根据 设备 编号 和 块 编号 命名 的 缓冲 区 的 函数 〈 表 7- 
6， 代 码 清单 7-10 ) 。 按 顺序 遍历 相应 设备 的 b-list， 寻 找 是 否 存在 所 需 
的 绥 冲 区 。 找 到 后 将 其 从 av-list 中 删除 (设置 标志 位 B BUSYO ， 并 返 
回 该 缓冲 区 。 如 果 已 设置 了 该 缓冲 区 的 标志 位 B_BUSY， 则 设置 标志 位 
B WANTED 并 进入 睡眠 状态 。 当 正在 使 用 该 缓冲 区 的 其 他 进程 将 其 释放 
后 ， 进 程 将 被 唤醒 。 


如 果 b-list 中 不 存在 所 需 的 缓冲 区 ， 则 取得 位 于 av-list 头 部 的 缓冲 区 
《设置 其 标志 位 为 B_BUSY) ， 对 其 重新 命名 ， 并 追加 到 b-list 的 头 部 ， 
然后 返回 该 缓冲 区 。 设 置 标志 位 B_BUSY 意 在 表示 该 缓冲 区 正 处 于 使 用 
中 的 状态 〈 图 7-8 ) 。 








+B_BUSY 


devA 的 devA 
xe LT 


(— HI E 如 果 存在 对 象 缓冲 区 ， 则 将 其 返回 


如 果 不 存 在 对 象 缓冲 区 ， 则 从 av-list 头 言 
取得 缓冲 区 并 将 其 插入 到 b-list 的 头 部 


图 7-8 getblk() 


在 尝试 从 av-list 取得 缓冲 区 时 ， 如 果 该 缓冲 区 的 类 型 为 B_DELWRI〈 延 
人 述 写 入 ) ， 则 需要 对 设备 进行 异步 读 写 。 


表 7-6 getblk() 的 参数 





1 getblk(dev, blkno) 

2 { 

3 register struct buf *bp; 

4 register struct devtab *dp; 

5 extern lbolt; 

6 

7 if(dev.d major »- nblkdev) 

8 panic("blkdev"); 

9 
10 loop: 
11 if (dev « 0) 
12 dp = &bfreelist; 
13 else ( 
14 dp - bdevsw[dev.d major].d tab; 
15 if(dp == NULL) 
16 panic("devtab"); 
17 for (bp=dp->b forw; bp !- dp; bp = bp-»b forw) { 
18 if (bp-»b blkno!-blkno || bp-»b dev!-dev) 
19 continue; 
20 spl6(); 
21 if (bp-»b flags&B BUSY) ( 
22 bp->b_flags =| B_WANTED; 
23 sleep(bp, PRIBIO); 
24 spl0e(); 
25 goto loop; 
26 
27 spl0(); 
28 notavail(bp); 
29 return(bp); 

30 } 


32 spl6(); 


33 if (bfreelist.av forw -- &bfreelist) { 
34 bfreelist.b flags -| B WANTED; 
35 sleep(&bfreelist, PRIBIO); 

36 spl0e(); 

37 goto loop; 

38 

39 sple(); 

40 notavail(bp = bfreelist.av forw); 
41 if (bp-»b flags & B DELWRI) ( 

42 bp-»b flags -| B ASYNC; 

43 bwrite(bp); 

44 goto loop; 

45 } 

46 bp-»b flags = B BUSY | B RELOC; 
47 bp-»b back-»b forw = bp-»b forw; 
48 bp-»b forw-»b back = bp-»b back; 
49 bp-»b forw = dp-»b forw; 

50 bp-»b back = dp; 

51 dp-»b forw-»b back = bp; 

52 dp-»b forw = bp; 

53 bp-»b dev - dev; 

54 bp-»b blkno = blkno; 

55 return(bp); 

56 ) 





7-8 ”如 果 大 编写 的 值 过 大 则 调用 panic(): 


11~12 NODEV (-1) 时 的 处 理 。 将 dp 设置 为 NODEV 的 b-list 的 起 
RUR. 


13 dE NODEV 时 的 处 理 。 


14~16 从 bdevsw[ ] 中 取得 相应 设备 的 devtab 结构 体 〈b-list 的 
起 始 元 素 ) 。 


17219 W) b-list， 检 查 是 否 存 在 所 需 的 缓冲 区 。 
20 ”如 果 成 功 找 到 ， 则 将 处 理 占 优先 级 提升 为 6， 防 止 发 生 中 断 。 


由 于 块 设备 处 理 结束 时 引发 的 中 断 处 理 等 会 操作 缓冲 区 ， 因 此 抑制 
中 断 可 以 避免 在 操作 缓冲 区 时 发 生 冲 突 。 





21-26 ”如 果 此 绥 冲 区 正在 使 用 ， 则 设置 B_WANTED 标志 位 并 进入 
睡眠 状态 。 


27-29 将 处 理 堪 优先 级 重 置 为 0， 设 置 处 于 使 用 中 的 标志 位 ， 然 
后 将 缓冲 区 从 av-list 中 删除 ， 返 回 该 缓冲 区 。 


32 ”如果 在 b-list 中 没有 找到 所 需 的 缓冲 区 ， 或 是 希望 取得 NODEV 
的 缓冲 区 时 ， 从 av-list 中 取得 缓冲 区 ， 并 将 处 理 器 优先 级 提升 至 6 
防止 发 生 中 断 。 


33-38 av-list 为 空 时 的 处 理 。 设 置 av-list 的 起 始 元 素 bfreelist 
HJ B. WANTED 标志 位 并 进入 睡眠 状态 。 


39 ”将 处 理 器 优先 级 重 置 为 0。 


40 取得 av-list 的 起 始 元 素 的 缓冲 区 ， 将 其 从 av-list 中 删除 ， 并 对 
其 设置 B_BUSY 标志 位 。 


41~45 如果 取 得 的 缓冲 区 设置 了 B_DELWRI GERIA) 标志 位 ， 
则 立刻 对 设备 进行 异步 号 入 ， 且 无 需 等 待 设备 的 处 理 结束 。 


46 B RELOC 标志 位 在 UNIX V6 中 未 被 使 用 。 此 时 只 设置 了 
B BUSY (和 B_RELOC) 标志 位 。 请 注意 ， 不 是 bp->b flags =| 
而 是 bp->b flags =。 
47-48 ”将 绥 冲 区 从 当前 分 配 的 b-list 中 删除 。 
49~52 ”将 缓冲 区 追加 至 新 的 b-list 的 起 始 位 置 。 
53-54 ”为 缓冲 区 命名 。 
55 返回 缓冲 区 。 
notavail() 


notavail() 是 将 缓冲 区 从 av-list 中 删除 ， 同 时 设置 B_BUSY (使 用 
H) 标志 位 的 函数 GR 7-7， 代 码 清单 7-11 ) 。 


K 7-7 notavail( 的 参数 








1 notavail(bp) 
2 struct buf *bp; 


register struct buf *rbp; 
register int sps; 


rbp - bp; 

sps - PS-»integ; 

sple(); 

rbp-»av back-»av forw = rbp-»av forw; 
rbp-»av forw-»av back = rbp-»av back; 
rbp-»b flags -| B BUSY; 

PS-»integ - sps; 





9 将 处 理 器 优先 级 提升 至 6， 防止 发 生 中 断 。 由 于 块 设 备 引 发 的 
中 断 处 理 等 会 操作 缓冲 区 ， 因 此 抑制 中 断 可 以 避免 在 操作 缓冲 区 时 
发 生 冲 突 。 
10~11 从 av-list 中 删除 对 象 缓冲 区 。 
12 设置 B_BUSY 标志 位 ， 表 明 此 缓冲 区 正在 使 用 。 
13 ”将 处 理 器 优先 级 恢复 原 值 。 

brelse() 

brelse() 用 来 释放 缓冲 区 “〈 清 除 B_BUSY 标志 位 ) ， 并 将 被 释放 的 组 


冲 区 追加 至 av-list CX 7-8， 代 码 清单 7-12 ) 。 已 分 配给 b-list 的 缓冲 
区 不 会 从 b-list 中 删除 。 


K 7-8 brelse() 的 参数 








1 brelse(bp) 
2 struct buf *bp; 


register struct buf *rbp, **backp; 
register int sps; 


rbp - bp; 
if (rbp-»b flags&B WANTED) 


wakeup(rbp); 

if (bfreelist.b flags&B WANTED) { 
bfreelist.b flags =& -B WANTED; 
wakeup(&bfreelist); 

j 

if (rbp-»b flags&B ERROR) 
rbp-»b dev.d minor = -1; 

backp = &bfreelist.av back; 

sps - PS-»integ; 

sple(); 

rbp-»b flags -& «(B WANTED|B BUSY|B ASYNC); 

(*backp)-»av. forw = rbp; 

rbp-»av back = *backp; 

*backp = rbp; 

rbp-»av forw = &bfreelist; 

PS-»integ - sps; 





8-9 唤醒 正在 等 竺 当前 缓冲 区 的 进程 。 


10~13 ”唤醒 正在 等 待 缓 冲 区 要 补充 到 av-list 的 进程 。 清 除 
bfreelist 的 B WANTED 标志 位 。 


14415 如果 由 于 设备 操作 错误 导致 设置 了 缓冲 区 的 错误 标志 ， 则 


将 小 编号 设置 为 -1。 绥 冲 区 的 设备 编号 发 生 了 变化 ， 如 果 不 通过 
av-list 重新 分 配 ， 此 缓冲 区 将 无 法 再 次 取得 ， 因 为 其 中 容纳 的 数据 
有 可 能 是 错误 的 ， 需 要 防止 错误 数据 被 使 用 。 

17~18 ”保存 PSW， 将 处 理 器 优先 级 提升 至 6 防止 发 生 中 断 。 

19 ”清除 B_WANTED、B_BUSY 和 B ASYNC 标志 位 。 

20-23 ”将 绥 冲 区 返回 至 av-list 的 末尾 。 


24 ”将 处 理 器 优先 级 返回 原 值 。 





7.5 WH 
该 取 的 种 类 
读 取 分 为 同步 读 取 和 异步 读 取 两 种 类 型 。 


同步 读 取 时 ， 进 程 首 先 使 用 getblk() 取得 缓冲 区 ， 然 后 对 块 设备 提出 
读 取 请 求 ， 并 执行 iowait() 进入 睡眠 状态 。 当 块 设备 的 处 理 完 成 后 ， 
由 中 断 处 理 函 数 执行 的 iodone() 唤醒 入 睡 的 进程 。 随 后 ， 该 进程 执行 
brelse()， 释放 获取 的 缓冲 区 (图 7-9 ) 。 


异步 读 取 时 ， 进 程 继续 原 有 人 处理， 无 需 等 待 块 设备 的 读 取 处 理 结束 。 绥 
冲 区 由 中 断 处 理 函 数 执行 的 iodone() 自动 释放 。 当 已 设置 了 缓冲 区 的 
B ASYNC 标志 位 时 ， 表 示 当 前 读 取 为 异步 读 取 (图 7-10 ) 。 


异步 读 取 采 用 预 读 取 的 方式 。 该 方式 指 按 顺 序 读 取 属 于 某 个 文件 的 块 
时 ， 预 先 将 下 一 个 块 的 数据 读 取 至 绥 冲 区 。 











进程 1 进程 2 


getblk() 
- B BUSY 








iowalt() 


读 出 数据 
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brelse() 
— B BUSY 


图 7-9 同步 读 取 


块 设备 







getblk() 
4 B BUSY 


4B. ASYNC 读 取 请 求 


本 一 一 一 一 一 一 一 一 一 + 


中 断 处 理 中 断 
函数 
4 B DONE iodonen 
brelse() 
= B. BUSY 


图 7-10 异步 读 取 

bread() 

bread() 是 进行 同步 读 取 的 函数 〈 表 7-9， 代 码 清单 7-13) 。 它 通过 检 
查 由 getblk() 获取 的 缓冲 区 的 B_DONE 标志 位 来 判断 缓冲 区 内 的 数据 
是 否 为 最 新 。 如 果 为 最 新 则 不 会 访问 设备 ， 人 否则 会 对 设备 进行 访问 。 

表 7-9 bread() 的 参数 





blkno 块 编号 


代码 清单 7-13 bread() (dmr/bio.c) 


read(dev, blkno) 


ca 0 


register struct buf *rbp; 


rbp = getblk(dev, blkno); 
if (rbp-»b flags&B DONE) 
return(rbp); 
rbp-»b flags -| B READ; 
rbp-»b wcount = -256; 
(*bdevsw[dev.d major].d strategy)(rbp); 
iowait(rbp); 
return(rbp); 


1 
2 
3 
4 
5 
6 
7 
8 





8-10 EB READ 标志 位 ， 将 读 取 长 度 设 定 为 -256 CER 512 F 
节 ) ， 然 后 执行 设 定 于 bdevsw[ ] 中 的 设备 访问 函数 。 


11 执行 iowait()， 进 入 等 竺 状态 直到 设备 的 读 取 处 理 结 
12 返回 缓冲 区 ， 该 缓冲 区 用 来 容纳 从 设备 读 取 的 数据 。 
iowait() 


iowait() 是 等 竺 设备 处 理 结束 的 函数 《〈 表 7-10， 代 码 清单 7-14 ) o "E 
使 进程 进入 睡眠 状态 直至 设置 缓冲 区 的 B. DONE 标志 位 。 


K 7-10 iowait() 的 参数 











代码 清单 7-14 iowait() (dmr/bio.c) 


1 iowait(bp) 
2 struct buf *bp; 


register struct buf *rbp; 


rbp = bp; 

spl6(); 

while ((rbp-»b flags&B DONE)--0) 
sleep(rbp, PRIBIO); 

sple(); 

geterror(rbp); 





iodone() 


iodone() 是 在 块 设 备 的 处 理 结 束 后 被 调用 的 函数 ， 用 来 设置 缓冲 区 的 
B DONE 标志 位 〈 表 7-11， 代 码 清单 7-15 ) 。 它 在 块 设备 处 理 结束 时 执 
行 的 中 断 处 理 函 数 中 被 调用 。 


同步 读 写 时 ， 唤 醒 正 在 等 竺 缓冲 区 的 进程 。 寞 步 读 写 时 执行 brelse() 
释放 缓冲 区 。 


表 7-11 iodone() 的 参数 








代码 清单 7-15 iodone() (dmr/bio.c) 





1 iodone(bp) 
2 struct buf *bp; 


3 1{ 


4 register struct buf *rbp; 
5 
6 rbp = bp; 


7 if(rbp-»b flags&B MAP) 


8 mapfree(rbp); 
9 rbp-»b flags -| B DONE; 
10 if (rbp-»b flags&B ASYNC) 
11 brelse(rbp); 
12 else ( 
13 rbp-»b flags =& -B WANTED; 
14 wakeup(rbp); 
15 } 
16 } 





7-8 ”在 PDP-11/40 的 环境 下 不 做 任何 处 理 。 
geterror() 


geterror() 是 处 理 错误 的 函数 〈 表 7-12， 代 码 清单 7-16) 。 如 果 未 设置 
buf.b flags 的 错误 标志 位 ， 则 不 做 任何 处 理 。 


K 7-12 geterror() 的 参数 








1 geterror(abp) 
2 struct buf *abp; 


register struct buf *bp; 


bp - abp; 
if (bp-»b flags&B ERROR) 
if ((u.u error = bp-»b error)--0) 
u.u error - EIO; 





breada() 

breada() EARRA ies. BIBT t8 RRRA ERU CK 7-13, 
代码 清单 7-17 ) 。 预 读 取 是 异步 进行 的 ， 当 设备 的 读 取 处 理 结束 时 ， 
由 块 设备 驱动 执行 的 iodone() 释放 缓冲 区 。 


表 7-13 breada() 的 参数 



























































reada(adev, blkno, rablkno) 


register struct buf *rbp, *rabp; 
register int dev; 


dev adev; 
rbp = 6€; 
if (lincore(dev, blkno)) ( 
rbp = getblk(dev, blkno); 
if ((rbp-»b flags&B DONE) -- 0) ( 
rbp-»b flags -| B READ; 
rbp-»b wcount = -256; 
(*bdevsw[adev.d major].d strategy)(rbp); 


} 


} 
if (rablkno && !incore(dev, rablkno)) { 
rabp = getblk(dev, rablkno); 
if (rabp-»b flags & B DONE) 
brelse(rabp); 
else ( 
rabp-»b flags -| B READ|B ASYNC; 


22 rabp-»b wcount = -256; 


23 (*bdevsw[adev.d major].d strategy)(rabp); 
24 } 

25 } 

26 if (rbp--0) 

27 return(bread(dev, blkno)); 

28 iowait(rbp); 

29 return(rbp); 

30 ) 





8 执行 incore()， 检 得 准备 读 取 的 设备 的 块 的 缓冲 区 是 否 存在 。 


9~14 ”如果 绥 冲 区 不 存在 ， 则 执行 getblk() RREK. WR r 
未 设置 获取 的 缓冲 区 的 B_DONE 标志 位 ， 则 启动 从 设备 读 取 数据 的 
处 理 。 

16 ”准备 进行 预 处 理 ， 且 缓冲 区 不 存在 时 的 处 理 。 


17-24 ”执行 getblk() 获取 缓冲 区 。 如 果 已 设置 了 获取 的 缓冲 区 
的 B DONE 标志 位 ， 则 表示 已 有 数据 被 读 取 ， 因 此 要 执行 

brelse() 释放 缓冲 区 。 如 果 未 设置 B_DONE 标志 位 ， 则 开始 从 设 
备 读 取 数 据 的 处 理 。 请 注意 ， 此 处 并 没有 等 待 读 取 处 理 执 行 结束 。 


26~27 WREKE GEMO 的 块 的 缓冲 区 已 经 存在 ， 则 执 
行 bread() 读 取 数据 ， 并 返回 该 缓冲 区 。 


28 执行 iowait() 等 待 设备 的 同步 读 取 处 理 结 

29 返回 同步 读 取 的 缓冲 区 。 
incore() 
incore() 检查 分 配给 某 个 设备 的 某 个 块 的 缓冲 区 是 否 存 在 〈 表 7-14, 
代码 清单 7-18 ) 。 如 果 存 在 则 返回 该 缓冲 区 ， 如 果 不 存 在 则 返回 
0. incore() 遍历 该 设备 的 b-list， 对 buf 结构 体 的 b_ blkno lb dev 
分 别 进行 检查 。 
表 7-14 incore() 的 参数 

[| 








代码 清单 7-18 incore() (dmr/bio.c) 


incore(adev, blkno) 

{ 
register int dev; 
register struct buf *bp; 
register struct devtab *dp; 


dev - adev; 


dp - bdevsw[adev.d major].d tab; 
for (bp=dp->b forw; bp != dp; bp = bp-»b forw) 
if (bp-»b blkno--blkno && bp-»b dev--dev) 
return(bp); 
return(0); 





7.6 写 入 
写 入 的 种 类 
写 入 可 以 分 为 同步 写 入 、 异 步 写 入 、 延 迟 写 入 3 种 类 型 。 同 步 写 入 和 


延迟 写 入 时 ， 首 先 执行 getblk() 取得 缓冲 区 ， 随 后 将 准备 写 入 设备 的 
数据 写 入 该 缓冲 区 。 但 是 此 时 并 不 对 设备 提出 写 入 请 求 ， 而 是 在 设置 组 
冲 区 的 B_ASYNC 和 B_ DELWRI 标志 位 后 ， 执 行 brelse() 释放 缓冲 
区 。 


经 过 一 段 时 间 后 ， 当 再 次 执行 getblk()《〈 出 于 与 上 述 延 迟 写 入 不 同 的 
原因 ) ， 并 试图 再 次 分 配 已 设置 了 B_DELWRI 标志 位 的 缓冲 区 时 ， 将 以 
异步 执行 的 方式 对 设备 提出 写 入 数据 的 请 求 〈 图 7-11 ) 。 


此 外 ， 当 执行 刷新 缓冲 区 的 函数 bflush() 时 ， 也 会 使 用 已 设置 了 
B DELWRI 标志 位 的 缓冲 区 ， 对 设备 进行 写 入 处理 。 


进程 1 进程 2 


块 设 备 
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图 7-11 延迟 写 入 
bwrite() 


burite() 将 缓冲 区 内 的 数据 写 入 设备 〈 表 7-15， 代 码 清单 7-19 . du 
果 未 设置 B_ASYNC 标志 位 则 进行 同步 写 入 ， 和 否则 进行 异步 写 入 。 


K 7-15 bwrite() 的 参数 








参数 


n» 
x 











代码 清单 7-19  bwrite() ( dmr/bio.c) 


1 bwrite(bp) 
2 struct buf *bp; 


register struct buf *rbp; 
register flag; 


rbp - bp; 
flag = rbp-»b flags; 
rbp-»b flags -& ~(B READ | B DONE | B ERROR | B DELWRI); 


rbp-»b wcount = -256; 
(*bdevsw[rbp-»b dev.d major].d strategy)(rbp); 
if ((flag&B ASYNC) -- 0) ( 

iowait(rbp); 

brelse(rbp); 
) else if ((flag&B DELWRI)--0) 

geterror(rbp); 





9 ”清除 以 下 标志 位 : B READ. B DONE. B ERROR. B DELMWRI. 
11 执行 在 bdevsw[ ] 中 注册 的 设备 访问 函数 。 


12~14 ”如 果 未 设置 B_ASYNC 标志 位 ， 则 等 待 设备 处 理 结束 后 ， 调 
用 brelse() 释放 缓冲 区 。 


15~16 ”如 果 已 设置 B_ASYNC 标志 位 ， 则 不 等 待 设 备 处 理 结束 。 此 
外 ， 如 果 未 设置 B_DELWRI 标志 位 ， 则 调用 geterror() 对 错误 进 
行 检查 。 


bawrite() 





bawrite() 是 进行 异步 号 入 的 函数 〈 表 7-16， 代 码 清单 7-20 0 。 该 函 
数 首先 设置 B_ASYNC 标志 位 ， 然 后 调用 bwrite(). 


K 7-16 bawrite() 的 参数 








1 bawrite(bp) 
2 struct buf *bp; 


register struct buf *rbp; 
rbp - bp; 


rbp-»b flags -| B ASYNC; 
bwrite(rbp); 





bdwrite() 


bdwrite() 进行 延迟 写 入 〈 表 7-17， 代 码 清单 7-210 。 该 函数 首先 设 
置 表 示 延 迟 写 入 的 B_DELWRI 标志 位 ， 然 后 释放 缓冲 区 。 


表 7-17 bdwrite() 的 参数 














代码 清单 7-21 bdwrite() (dmr/bio.c) 





1 bdwrite(bp) 

2 struct buf *bp; 

31 

4 register struct buf *rbp; 


5 register struct devtab *dp; 
6 
7 rbp - bp; 
8 dp = bdevsw[rbp-»b dev.d major].d tab; 
9 if (dp == &tmtab || dp == &httab) 
10 bawrite(rbp); 
11 else ( 
12 rbp-»b flags -| B DELWRI | B DONE; 
13 brelse(rbp); 
14 } 
15 } 





8-10 ”如 果 写 入 的 对 象 为 磁带 设备 ， 则 调用 bawrite() 并 立刻 进 
行 写 入 处 理 。 


bflush() 


bflush() 将 延迟 号 入 缓冲 区 内 的 数据 一 次 性 写 入 设备 《〈 表 7-18， 代 码 
清单 7-22 ) 。bflush() 被 update() 调用 ， 而 update() 被 
panic(). sync(). sumount() 调用 。 





fr UNIX V6 的 环境 中 ， 和 守护 程序 /etc/update 每 隔 30 秒 运行 一 次 
sync 指令 。 


K 7-18 bflush() 的 参数 



























































flush(dev) 


register struct buf *bp; 


sp16(); 


7 for (bp = bfreelist.av forw; bp !- &bfreelist; bp = bp-»av forw) { 


8 if (bp->b flags&B DELWRI && (dev == NODEV||dev--bp-»b dev)) ( 
9 bp-»b flags -| B ASYNC; 

10 notavail(bp); 

11 bwrite(bp); 

12 goto loop; 

13 } 

14 } 

15 spl0(); 


16 ) 





7.7 RAW 输入 输出 


physio() 


physio() 是 进行 RAW 输入 输出 的 函数 〈 表 7-20， 代 码 清单 7-230 。 
传送 数据 的 地 址 、 长 度 以 及 在 块 设备 中 的 偏 移 量 ， 都 通过 user 结构 体 
指定 C 7-19) 。 

physio() 由 注册 于 字符 设备 驱动 表 中 用 于 RAW 输入 输出 的 设备 驱动 
调用 。 所 使 用 的 缓冲 区 不 是 buf[] ， 而 是 供 RAW 输入 输出 专用 的 缓冲 
区 (参见 第 8 章 ) 。 


处 理 的 流程 为 : 读 入 用 户 APR 的 值 ， 根 据 虚 拟 地 址 直接 计算 出 物理 地 
址 ， 然 后 回 绥 冲 区 传递 参数 ， 表 执行 访问 块 设备 的 函数 。 


表 7-19 传递 给 physio() 的 user 结构 体 成 员 变 量 

















传送 数据 的 虚拟 地 址 (以 字 节 为 单位 





块 设备 中 的 偏 移 量 (以 字 节 为 单位 ) 


传送 数据 长 度 〈 以 字 节 为 单位 ) 








K 7-20 physio() 的 参数 





指向 块 设备 访问 函数 的 指针 


abp 





ixi 


缓冲 区 。 使 用 的 是 RAW 输入 输出 专用 的 缓冲 























1 physio(strat, abp, dev, rw) 
2 struct buf *abp; 

3 int 
4 { 


(*strat)(); 
register struct buf *bp; 
register char *base; 
register int nb; 
int ts; 
bp = abp; 
base = u.u_base; 
if (base&01 || u.u count&O1 || base>=base+u.u_count) 
goto bad; 
ts = (u.u tsize-127) & -0177; 
if (u.u sep) 
ts = ð; 
nb = (base>>6) & 01777; 
if (nb < ts) 
goto bad; 


if ((((base+u.u_count)>>6)&01777) >= ts+u.u_dsize 
&& nb < 1024-u.u_ssize) 
goto bad; 
spl6(); 
while (bp->b_flags&B_BUSY) { 
bp->b_flags =| B_WANTED; 
sleep(bp, PRIBIO); 
} 
bp->b_flags = B_BUSY | B_PHYS | rw; 
bp->b_dev = dev; 
bp->b_addr = base&677 ; 
base = (u.u sep? UDSA: UISA)-»r[nb»»7] + (nb&0177); 
bp->b_addr =+ base<<6; 
bp->b_xmem = (base>>10) & 077; 
bp-»b blkno = lshift(u.u offset, -9); 


35 bp-»b wcount = -((u.u count»»1) & 077777); 


36 bp-»b error - 6; 

37 u.u procp-»p flag -| SLOCK; 

38 (*strat)(bp); 

39 spl6(); 

40 while ((bp-»b flags&B DONE) -- 0) 
41 sleep(bp, PRIBIO); 

42 u.u procp-»p flag =& -SLOCK; 

43 if (bp-»b flags&B WANTED) 

44 wakeup(bp); 

45 sple(); 

46 bp-»b flags -& «(B BUSY|B WANTED); 
47 u.u count = (-bp-»b resid)««1; 

48 geterror(bp); 

49 return; 

50 bad: 

51 u.u error - EFAULT; 

52 ) 








12-22 检查 作为 参数 传递 进来 的 user 结构 体 成 员 变 量 。 
o 传送 的 虚拟 地 址 为 偶数 
o 传送 的 数据 长 度 为 偶数 
o 虚拟 地 址 和 数据 长 度 之 和 是 否 洲 出 
e 是 否 试 图 传送 位 于 代码 段 领域 的 数据 





。 传送 数据 是 否 位 于 数据 领域 (下限 ) 和 栈 领 域 (上 限 ) 之 间 


此 时 ts 的 值 为 代码 段 的 长 度 〈 以 64 字 节 为 单位 ， 并 以 128x64 字 
节 为 单位 加 上 取 整 〉，nb 的 值 为 传送 数据 的 虚拟 地 址 (以 64 F 
为 单位 ) 。 

24-27 WRH RAW 输入 输出 使 用 的 绥 冲 区 正在 使 用 ， 则 设置 

B WANTED 标志 位 ， 然 后 进入 睡眠 状态 直到 缓冲 区 被 释放 。 


28~37 ”将 作为 参数 的 user 结构 体 传 递 给 缓冲 区 。 根 据 用 户 PAR 
的 值 从 虚拟 地 址 计算 得 到 物理 地 址 。 将 buf.b_xmenm 设 定 为 物理 内 
存 第 16 位 之 后 的 部 分 。 从 u.u_offset 计算 出 块 编号 ， 同 时 设 定 


执行 进程 的 SLOCK 标志 位 ， 防 止 进 程 被 换 出 至 交换 空间 。 
38 ”执行 设备 驱动 的 访问 函数 。 

40-41 进入 睡眠 状态 ， 等 待 块 设备 处 理 结束 。 

42 清除 SLOCK 标志 位 。 


如 朵 有 进程 在 等 每 供 RAW 输入 输出 使 用 的 缓冲 区 ， 则 将 
ZN i 醒 o 


47 buf.b_resid 中 保存 有 因 出 错 而 没 能 传送 的 数据 长 度 ， 将 其 
赋予 u.u_count。 


swap() 


swap() 是 进行 交换 处 理 的 函数 (Xe 7-21， 代 码 清 单 7-25 ) 。 该 函数 使 
用 buf 结构 体 类 型 的 变量 swbuf 代码 清单 7-24 ) 进行 RAW 输入 输 

出 实现 交换 处 理 (图 7-12 ) 。 因 为 swbuf 只 有 一 个 ， 无 法 同时 交换 两 
个 以 上 的 进程 ， 所 以 需要 进行 排他 处 理 。 


swap() 为 swbuf 设 定 适当 的 参数 ， 调 用 交换 磁盘 的 设备 驱动 读 写 数 
据 。 因 为 参数 的 长 度 以 64 字 节 为 单位 ， 所 以 需要 将 地 址 变 为 字 节 单 
位 ， 再 将 长 度 〈 字 长 ) 变 为 2 的 补 数 的 形式 。 这 些 值 最 后 都 会 赋予 交换 
磁盘 的 寄存 器 。 请 参考 physio() 以 及 第 8 章 中 有 关 RK 的 寄存 器 的 内 
容 。 











代码 清单 7-24 swbuf (bio.c) 


1 struct buf swbuf; 


交换 处 理 专用 的 buf 结 构 体 。 因 为 使 
用 RAW 输入 输出 ， 所 以 每 次 的 传送 
量 都 不 受 块 长 度 ( 512 字 节 ) 的 限 
制 。 但 是 ， 并 不 具备 缓存 的 功能 






物理 内 存 










图 7-12 swbuf 


K 7-21 swapO 的 参数 


blkno 优先 级 交换 磁盘 中 的 块 编号 





交换 对 象 的 物理 内 存 地 址 〈 以 64 字 节 为 单位 ) 


交换 对 象 的 长 度 〈 以 64 字 节 为 单位 ) 








代码 清单 7-25 swap( (dmr/bio.c) 





wap(blkno, coreaddr, count, rdflg) 


register int *fp; 


1 

2 

3 

4 

5 fp = &swbuf.b flags; 
6 sple(); 

7 while (*fp&B BUSY) ( 
8 *fp -| B WANTED; 
9 sleep(fp, PSWP); 
0 


11 *fp = B BUSY | B PHYS | rdflg; 


12 swbuf.b dev = swapdev; 

13 swbuf.b wcount = - (count««5); 

14 swbuf.b blkno - blkno; 

15 swbuf.b addr = coreaddr««6; 

16 swbuf.b xmem = (coreaddr»»10) & 077; 
17 (*bdevsw[swapdev»»8].d strategy)(&swbuf); 
18 spl6(); 

19 while((*fp&B DONE)--0) 

20 sleep(fp, PSWP); 

21 if (*fp&B WANTED) 

22 wakeup(fp); 

23 spl0(); 

24 *fp -& «(B BUSY|B WANTED); 

25 return(*fp&B ERROR); 

26 ) 





交换 磁盘 的 设备 编号 通过 swapdev 指定 《代码 清单 7-26 ) 。 系 统管 理 





者 可 以 根据 实际 环境 修改 这 个 值 ， 但 是 需要 对 内 核 进 行 重新 构筑 。 此 例 
中 大 编号 和 小 编号 都 被 设 为 0， 第 8 章 的 bdevsw[] 的 例子 (代码 清单 
8-1 ) 表示 的 是 RK 磁盘 。 

代码 清单 7-26 swapdev (conf.c) 


1 int swapdev ((0««8) |0) ; 

7-10 如果 有 其 他 进程 使 用 swbuf， 则 设置 swbuf.b flags 的 
B WANTED 标志 位 ， 然 后 进入 睡眠 状态 。 

11 如 果 可 以 使 用 swbuf， 则 设置 swbuf.b_flags 的 B_BUSY 标 
志 位 Cswbuf 使 用 中 ) ~ B PHYS 标志 位 (RAW 输入 输出 ) 和 
rdflg 标志 位 〈 读 取 或 写 入 ) 。 

12~16 设置 swbuf 的 参数 启动 交换 磁盘 的 输入 和 输出。 将 通过 参数 
设 定 的 以 64 字 节 为 单位 的 地 址 和 长 度 分 别 转 换 为 字 节 单位 和 2 的 
补 数 的 字 单 位 。 

17 调用 交换 磁盘 的 设备 驱动 。 

19-20 ”进入 睡眠 状态 等 竺 交换 磁盘 的 处 理 结 





21-22 ”交换 磁盘 的 处 理 结 束 后 ， 唤 醒 正 在 等 待 swbuf 的 进程 。 
24 清除 swbuf 的 B BUSY 标志 位 和 B_WANTED 标志 位 。 


25 返回 交换 处 理 成 功 与 否 的 标志 。 访 问 当 对 设备 失败 时 ， 设 备 驱 
动 Crkstrategy() 等 ) 将 设 定 swbuf.B_ERROR 标志 位 。 


78 ”小 结 

设备 分 为 块 设备 和 字符 设备 两 种 。 

设备 驱动 群 由 设备 驱动 表 进 行 管理 。 
设备 由 类 别 和 设备 编号 进行 管理 。 

为 了 使 用 设备 ， 必 须 提前 生成 特殊 文件 。 
对 块 设备 的 处 理 集中 在 块 设备 子 系统 中 。 


通过 块 设备 缓冲 区 访问 块 设备 。 绥 冲 区 保证 了 数据 的 一 臻 性， 同时 
也 起 到 缓存 的 作用 。 


读 取 分 为 同步 读 取 和 异步 读 取 。 预 读 取 功 能 采用 了 乔 步 读 取 。 
写 入 分 为 同步 写 入 和 异步 写 入 。 此 外 还 有 延迟 写 入 。 


通过 RAW 输入 输出 传输 数据 时 无 需 缓冲 区 ， 也 不 受 块 长 度 〈512 
字 节 ) 的 限制 。 
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7885 RRAIKI) 

8.1 什么 是 块 设备 驱动 

块 设备 驱动 为 操作 块 设备 的 程序 。 每 一 种 块 设备 都 具有 对 应 的 驱动 程 

序 。 驱 动 程序 集中 了 对 设备 的 各 种 操作 功能 ， 同 时 也 包含 了 设备 的 规格 
参数 。 其 他 程序 通过 调用 与 设备 对 应 的 驱动 程序 ， 可 以 在 无 须 了 解 设备 
的 详情 下 进行 操作 。 

本 章 主要 对 块 设备 驱动 进行 说 明 ， 字 符 设 备 驱动 将 在 第 12 章 中 介绍 。 

块 设备 驱动 表 

块 设备 驱动 通过 块 设备 驱动 表 bdevsw[] 进行 管理 (代码 清单 8-1， 表 
8-1) . bdevsw 结构 体 包含 打开 、 关 闭 、 访 问 相 应 设备 的 函数 地 址 ， 以 
及 指向 位 于 b-list 起 始 位 置 的 devtab 结构 体 的 地 址 。 这 些 函数 和 与 设 
备 引 发 的 中 断 相 对 应 的 处 理 函 数 ,构成 了 设备 驱动 的 实体 。 


代码 清单 8-1 bdevsw[] Cconf.h) 











truct bdevsw 


int (*d open)(); 


int (*d close)(); 
int (*d strategy) (); 
int *d tab; 

) bdevsw[]; 





K 8-1 bdevsw 结构 体 


ERE 
* 








含义 
指向 打开 设备 的 函数 的 指针 


(*d close)O | 指向 关闭 设备 的 函数 的 指针 




















(*d strategy) | 指向 访问 设备 的 函数 的 指针 。 读 取 和 写 入 共用 一 个 函数 ， 通 过 绥 冲 区 
() 


的 标志 位 判断 进行 何 种 操作 


指向 devtab 结构 体 的 指针 


bdevsw[ ] 本 身 定 义 在 conf.c 中 。bdevsw[ ] 中 包含 了 与 系统 中 所 有 块 
设备 《的 种 类 ) 相对 应 的 设备 驱动 。 系 统管 理 者 要 根据 系统 构成 编辑 
bdevsw[]， 并 对 内 核 进行 重新 构 贷 。 


代码 清单 8-2 bdevsw[] Cconf.c) 








> 
c 


(*bdevsw[])() 


一 HH. 


&nulldev, &nulldev, &rkstrategy, 
&nodev, &nodev, &nodev, 
&nodev, &nodev, &nodev, 
&nodev, &nodev, &nodev, 


&nodev, &nodev, &nodev, 
&nodev, &nodev, &nodev, 
&nodev, &nodev, &nodev, 
&nodev, &nodev, &nodev, 


co-Jopg uii» un.€nmÍ| 








设备 的 大 编写 与 bdevsw[ ] 的 数组 下 标 相 对 应 。 在 代码 清单 8-2 的 示例 
中 ， 大 编号 0 对 应 RK 磁盘 设备 ，1 对 应 RP 磁盘 设备 .…… 以 此 类 推 。 


设备 处 理 队 列 


设备 驱动 拥有 设备 处 理 队 列 。 队 列 头 部 的 元 系 与 b-list 相同 ， 为 
devtab 结构 体 (bdevsw[].d tab) 。 队 列 中 包含 缓冲 区 。devtab Zi 
构 体 的 d_actf 和 d_actl 分 别 指 同位 于 头 部 和 末尾 的 缓冲 区 ， 而 各 组 
冲 区 的 buf .av_forw 指 问 后 方 的 缓冲 区 。 末 尾 的 缓冲 区 的 
buf.av_forw 指 癌 NULL (0) à- 





设备 驱动 使 用 的 缓冲 区 的 状态 为 处 理 中 (B. BUSYO. ， 并 从 av-list 中 清 
除 。 因 此 ， 即 使 直接 操作 buf .av_forw 的 值 ， 也 不 会 和 av-list 发 生 冲 


zu 


Xo 


新 的 缓冲 区 被 奶 加 到 队列 的 末尾 ， 设 备 驱 动 从 队列 的 头 部 开始 处 理 〈 图 
8-1) 。 


d actl 


d Wee av. si auc T av - — av. forw 





bdevswil[n]. 
d tab 


uu hr d 
图 8-1 设备 处 理 队 列 
处 理 流程 


块 设备 的 处 理 流程 如 下 所 示 (图 8-2 ) 。 请 注意 ， 具 体 细节 由 设备 驱动 
的 实现 方法 决定 ， 这 里 给 出 的 只 是 比较 典型 的 例子 。 


1. 内 核 〈 主 要 是 块 设备 子 系统 ) 执行 访问 函数 
2. 将 传递 进来 的 缓冲 区 追加 至 设备 处 理 队列 


3. 操作 设备 的 寄存 器 ， 并 开始 对 位 于 设备 处 理 队列 头 部 的 缓冲 区 进行 输 
入 输出 处 理 


4. 处 理 结 束 后 设备 将 引发 中 断 。 如 果 设 备 处 理 队 列 中 还 留 有 缓冲 区 ， 中 
断 处 理 函 数 将 继续 进行 输入 输出 处 理 


当 系 统 运行 时 ， 打 开设 备 的 函数 会 预先 对 设备 进行 初始 化 处 理 。 当 系统 
运行 结束 时 ， 关 闭 设备 的 函数 将 终止 设备 的 运行 。 根 据 设 备 的 种 类 ， 记 
些 处 理 也 不 总 是 必须 进行 的 。 














We | 周边 设备 
设备 处 理 队列 | 
@) 缓 冲 区 被 追加 到 | 
a 头 部 开始 进行 输入 
n] p 
人 执行 访问 函数 输出 处 理 
e 


由 设 备 处 理 结束 时 
引发 中 断 


图 8-2 块 设备 驱动 的 处 理 流程 


82 RK-11 磁盘 驱动 


下 面 以 DEC 公司 开发 的 RK-11 磁盘 的 设备 驱动 为 例 介 绍 块 设备 驱动 。 
RK-11 磁盘 具有 多 个 型 号 ， 此 处 以 RK11-D 为 对 象 。 


RK11-D 
RK11-D 是 由 1 个 磁盘 控制 器 及 工 台 磁盘 构成 的 大 容量 块 设备 。 此 外 还 


可 以 人 退 加 7 台 型 号 为 RK05 的 磁盘 ， 使 RK11-D 具备 管理 8 R Re 
力 。 厂 盘 具 有 各 上 自 的 小 编号 〈 图 8- 3 ) o K 8-2 为 磁盘 的 规格 。 


RK11-D RK05 








小 编号 0 小 编号 1 小 编号 2 







拥有 控制 用 的 
寄存 器 


小 编号 3 


小 编号 4 小 编号 5 小 编号 6 小 编号 7 


Unibus 
最 多 可 设置 8 台 磁 盘 ， 各 磁盘 具有 属于 自己 的 小 编号 
图 8-3 RK11-D 


表 8-2 RK11-D 





磁道 〈 柱 面 ) / 盘面 20043 Cf 


盘面 / 磁盘 2 








5E I BÀ 256 


oo OOOO 

po O 

e o 
特殊 文件 


系统 管理 者 在 目录 /dev 下 生成 名 为 rkn Ov 为 小 编写) 的 特殊 文件 。 


8 以 上 的 小 编号 具有 特殊 意 X. 数据 分 散 保存 于 rk0 至 rk(x-8)! 的 各 个 
磁盘 中 。 小 编号 为 4 (d 大 于 等 于 8 ) 的 设备 编号 为 b 的 块 ， 实 际 对 应 
小 编号 为 b%(d-7) 的 设备 b/(d-7) (小 数 点 的 部 分 向 下 取 整 ) 的 块 。 比如 
说 小 编号 为 10 的 设备 编号 为 10 的 块 ， 实 际 对 应 小 编号 为 1 的 设备 编号 
为 3 的 块 (CR 8-3) 。 i a 
值 ， 可 以 将 所 有 磁盘 模拟 为 一 台大 容量 的 磁 移 


1 此 处 的 x 表示 任意 大 于 等 于 8 的 小 编号 。 即 磁盘 rkx 的 数据 将 分 散 保存 于 rk0 至 rk(x-8) 的 各 
个 磁盘 中 。 人 参见 表 8-3。 一 -一 译 者 注 
































表 8-3 小 编号 为 10 的 设备 编号 为 10 的 块 








作为 供 RAW 输入 输出 使 用 的 特殊 文件 ， 在 目录 /dev 下 同时 也 生成 名 
Cn 为 小 编号 ) 的 特殊 文件 。 对 应 的 设备 种 类 被 设 定 为 字符 设 
WE bdevsw[] 

以 下 的 说 明 是 假设 RK 磁盘 的 大 编号 为 0。 将 bdevsw[0] 设 定 为 RK 的 
磁盘 驱动 (代码 清单 8-3 ) 。RK 磁盘 因为 无 需 做 打开 和 关闭 处 理 ， 所 
以 相应 的 函数 也 会 被 设 为 nulldev()。 访 问 函 数 为 rkstrategy()， 而 
bdevsw.d tab 被 设 定 为 ktab 〈 代 码 清单 8-4 ) 。 


代码 清单 8-3 bdevsw[] 中 的 相关 部 分 (conf.c) 





3 &nulldev, &nulldev, &rkstrategy, rktab, /* rk */ 


代码 清单 8-4 rktab (dmr/rk.c) 


1 struct devtab rktab; 


rp Br Ah EE PR Zie 


RK 磁盘 在 处 理 结束 后 ， 会 通过 中 断 优先 级 5、 疝 量 0220 引发 中 断 。 将 
执行 与 向 量 对 应 的 中 断 处 理 函数 rkintr()， 针 对 缓冲 区 进行 结束 输入 
输出 的 处 理 。 当 设备 发 生 错 误 时 将 重 试 10 次 ， 重 试 的 次 数 由 


devtab.d errcnt 管理 。 





RK11-D 的 寄存 器 


RK11-D 具有 7 个 控制 寄存 器 (X 8-4 ) . RKCS 的 第 0 比特 位 为 1 
时 ，RKBA 和 RKCS 的 5~4 比特 表示 的 物理 内 存 地 址 和 RKDA 表示 的 
磁盘 地 址 之 间 ， 将 传输 RKWC 定义 的 长 度 的 数据 。 


K 8-4 RK11-D 的 寄存 器 


> ET S E OE 2 d VAS 
Drive Status 寄存 器 d. E 表 示 磁 盘 驱 动 中 发 生 错 误 时 才 使 




















用 。 参 见 表 8-6 


(es 表示 错误 状态 。 只 有 在 表示 磁盘 驱动 中 发 生 错 误 时 才 使 


RKCS Status 寄存 

















RKWC | Word Count 寄存 器 


Current Bus Address | 4. — Vd RSS ; AME o. 
寄存 器 表示 内 存 中 待 传送 数据 的 地 址 。 参 见 表 


pe pue AM | 表示 磁盘 中 待 传送 数据 的 地 址 。 参 见 表 8-10 


,wa | 在 控制 器 和 磁盘 间 传 输 数据 时 使 用 。 区 动 不 对 其 进 
RKDB |Data Buffer 寄存 器 | 行 操作 。 人 参见 表 8-11 















































表 8-5 RKDS 





15-13 | 表示 引发 中 断 的 磁盘 





连接 的 磁盘 为 RK05 





人 磁盘 中 发 生 异 


寻 址 (seek)〉 尚未 结束 


表示 Sector Counter 上 








被 选择 的 磁盘 是 否 处 于 Ready 状态 




















TU REGLTURSCK AE IAE T OR STEMS, 即 磁盘 是 否 处 于 可 以 接受 下 一 个 请 求 














H XM E. 

















发 现 磁盘 已 断 电 。 或 者 选中 的 磁盘 未 处 于 Ready 状态 ， 或 是 发 生 





























14 | 在 进行 Read. Write, Read Check, Write Check 处 理 时 ， 发 生 磁盘 地 址 溢出 错 














试图 向 只 读 磁 盘 写 入 数据 


























在 进行 Read. Write, Read Check, Write Check 处 理 时 ， 磁 盘 的 磁头 并 未 移动 
到 适当 的 位 置 
































ÆT Read 或 Write 之 外 的 处 理 时 ， 设 置 RKCS 的 第 10 比特 位 


内 存 未 应 答 



































Wri ie Bk Write Check 处 理 时 ， 处 理 尚 未 结束 但 是 已 有 多 个 缓冲 区 文件 被 清 
是 在 Read 处 理 时 ， 处 理 尚未 结束 但 是 已 有 多 个 缓冲 区 文件 被 写 满 




































































试图 访问 并 不 存在 的 磁 担 


| 式 图 访问 并 不 存在 的 柱 面 

















试图 访问 并 不 存在 的 肩 区 

















Read Check 或 Read 处 理 时 发 生 校 验 错误 




















Write Check 时 发 生 错 误 


K 8-7 RKCS 








ak 
Ij 
x 











当 设 置 了 RKER 的 任意 一 位 时 置 1 
hs [as Seek 或 Reset 处 理 结束 并 引发 了 中 断 

Ur 
磁盘 格式 化 时 置 1 






































置 1 时 表示 当 软 件 异 常 时 终止 对 磁盘 的 操作 


表示 处 于 可 接受 操作 的 状态 CReady) 





























置 1 时 表示 当 磁 盘 的 处 理 结束 或 发 生 错 误 时 ， 通 过 向 量 0220 引发 中 断 























扩展 RKBA 的 地 址 。 设 定 为 内 存 中 待 传送 数据 的 18 比特 物理 地 址 的 高 位 2 比 
特 的 数据 。 当 RKBA 溢出 时 递 所 








000: Reset, 001: Write, 010: Read, 011: Write Check, 100: Seek, 101 
: Read Check, 110: Drive Reset, 111: Write Lock 


n 置 1 时 表示 局 动 磁盘 


468-8 RKWC 





























c. es CFK) o REN 2 的 补 数 形式 


表 8-9 RKBA 














内 存 中 待 传送 数据 的 物理 地 址 的 低位 16 比特 











表 8-10 RKDA 











dim (0-7) 

















柱 面 编号 。 

















100/12=8(1000)，8(1000)>>1=4(100) 





time. 




















8(1000)&1-0 


表 8-11 RKDB 


比特 位 


在 控制 器 和 磁盘 间 传 输 数据 时 使 有 














( 块 编号 /12) >>1。 例 如 ， 当 块 编 号 为 100 时 ， 






































( 块 编号 /12) & 1。 例如 ， 当 块 编号 为 100 时 ，100/12=8(1000)， 











rkstrategy() 


rkstrategy() 是 对 





RK 磁盘 进行 读 写 的 函数 CK 8-12， 代 码 清单 8-5 


) 。 首 先 将 缓冲 区 追加 至 设备 处 理 队 列 的 末尾 ， 然 后 执行 rkstart() 
访问 RK 磁盘 。 


K 8-12 rkstrategy() 的 参数 








1 rkstrategy(abp) 
2 struct buf *abp; 


register struct buf *bp; 
register *qc, *ql; 
int d; 


bp - abp; 
if(bp-»b flags&B PHYS) 
mapalloc(bp); 


d = bp-»b dev.d minor-7; 

if(d <= 0) 
d-21; 

if (bp-»b blkno >= NRKBLK*d) ( 
p-»b flags -| B ERROR; 
odone(bp) ; 
eturn; 

j 

bp-»av forw - 6; 

spl15(); 

if (rktab.d actf--0) 
rktab.d actf - bp; 

else 
rktab.d actl-»av forw = bp; 

rktab.d actl - bp; 

if (rktab.d active--0) 
rkstart(); 

sple(); 





9.10 ”在 PDP-11/40 的 环境 下 不 做 任何 处 理 。 

11-18 ”如 果 块 编号 的 值 过 大 则 引发 错误 。 如 果 小 编号 小 于 8， 则 
与 一 个 人 磁 检 能 够 拥有 的 最 大 块 编写 NRKBLK (4872) (代码 清单 8- 
6) 进行 比较 。 大 于 等 于 8 时 与 (小 编号 -7) x4872 进行 比较 。 


代码 清单 8-6 NRKBLK (dmr/rk.c) 





1 #define NRKBLK 4872 


19 ”将 缓冲 区 的 末尾 设 为 0。 


J 5， 防 止 由 RK 引发 的 中 断 《中断 优先 
级 为 5) 。 


21-25 如果 设 备 处 理 队 列 为 空 ， 则 辐 队 列 的 起 始 位 置 妃 加 缓冲 
区 。 如 果 不 为 空 ， 则 将 缓冲 区 追加 至 末尾 位 置 。 


26-27 如果 rktab.d active 为 0 (RK 未 处 于 处 理 状 态 ) 则 执行 
rkstart()， 开 始 对 RK 磁盘 进行 该 写 操作 。 


28 将 处 理 器 优先 级 重 置 为 0。 
rkstart() 


rkstart() 是 启动 RK 磁盘 处 理 的 函数 〈 人 代码 清单 8-70 。 对 处 于 设备 
处 理 队 列 起 始 位 置 的 缓冲 区 进行 读 写 操作 。 


代码 清单 8-7 rkstart() (dmr/rk.c) 





kstart() 


register struct buf *bp; 


return; 
rktab.d activer; 


1 

2 

3 

4 

5 if ((bp = rktab.d actf) -- 0) 

6 

7 

8 devstart(bp, &RKADDR-»rkda, rkaddr(bp), 0); 
9 


| | 
5~6 ”如果 队列 为 衬 ， 则 不 做 任何 处 理 立 即 返 回 。 
7 递增 rktab.d_active， 表 示 RK 磁盘 处 于 处 理 中 的 状态 。 
8 执行 devstart() 启动 磁盘 处 理 。RKADDR 为 RK11-D 寄存 器 的 
基地 址 ，rkda 表示 基地 址 距 RKDA 地 址 的 差 值 (代码 清单 8-8, 
代码 清单 8-9) 。 

代码 清单 8-8 RKADDR (dmr/rk.c) 


1 #define RKADDR 0177400 


代码 清单 8-9 ”RK 寄存 器 参照 用 结构 体 Cdmr/rk.c) 


1 struct ( 
2 int 
3 int 
4 int 
5 
6 
7 
8 


int 
int 
int 


}; 





rkaddr() 


rkaddr() 利用 小 编号 和 块 编号 计算 用 于 赋予 RKDA 的 值 ( 表 8-13, RI 
清单 8-10 ) 。 计 算 内 容 请 参照 表 8-10。 


K 8-13 rkaddr() 的 参数 














代码 清单 8-10 rkaddr() (dmr/rk.c) 


1 rkaddr(bp) 
2 struct buf *bp; 


register struct buf *p; 
register int b; 
int d, m; 


p = bp; 

b p-»b blkno; 
m 

i 


p-»b dev.d minor - 7; 
f(m <= 0e) 

d = p->b_dev.d_minor; 
else { 

d = lrem(b, m); 

b = ldiv(b, m); 


} 
return(d<<13 | (b/12)<<4 | b%12); 





14 lrenm 为 用 汇编 语言 编写 的 函数 ， 用 来 计算 余数 。 

15 1div 为 用 汇编 语言 编写 的 函数 ， 用 来 计算 商 。 
devstart() 
devstart() 利用 绥 冲 区 中 设置 的 参数 ， 设 置 RKDA、RKBA、 
RKWC、RKCS 并 启动 设备 的 处 理 〈 表 8-14， 代 码 清单 8-11 ) 。 当 
RKCS 的 第 0 比特 位 变 为 1 时 ， 表 示 已 启动 RK 磁盘 的 处 理 。 


devstart() 对 应 多 种 磁盘 设备 ， 可 以 说 它 是 在 第 7 草 介 绍 过 的 块 设备 
子 系统 的 一 部 分 。 为 了 便于 说 明 ， 将 其 移 至 此 处 介绍 。 


K 8-14  devstart() 的 参数 

















devloc RKDA 的 地 址 


用 于 赋予 RKDA 的 值 





用 于 赋予 RKCS 的 值 


代码 清单 8-11 devstart() ( dmr/bio.c) 


1 devstart(bp, devloc, devblk, hbcom) 
2 struct buf *bp; 
3 int *devloc; 


register int *dp; 
register struct buf *rbp; 
register int com; 


dp = devloc; 
rbp - bp; 
*dp = devblk; 
*--dp = rbp-»b addr; 
*--dp = rbp-»b wcount; 
com - (hbcom««8) | IENABLE | GO | 
((rbp-»b xmem & 03) «« 4); 
if (rbp-»b flags&B READ) 
com =| RCOM; 
else 
com -| WCOM; 
*--dp = com; 





9 将 dp 设 定 为 RKDA 的 地 址 。 
11 将 RKDA 设 定 为 通过 参数 传递 进来 的 值 。 
12 移动 dp 分 别 访问 RKBA、RKWC 和 RKCS. 将 RKBA 设 为 组 


冲 区 的 地 址 。 内 核 程 序 中 的 数据 ， 其 虚拟 地 址 等 于 物理 地 址 (参照 
第 14 章 ) 。 


13 设 定 RKWC 的 值 。 


14-20 iE RKCS 的 值 。 代 码 清单 8-12 为 计算 时 使 用 的 参数 。 图 
8-4 表示 计算 的 内 容 。 因 为 内 核 程序 使 用 数据 的 虚拟 地 址 等 于 物理 
地 址 ， 且 物理 地 址 的 前 半 部 分 被 赋予 内 核 程 序 ， 所 以 buf.b_xmem 
的 值 通常 为 0。 


代码 清单 8-12 设置 RKCS 时 使 用 的 参数 


1 #define CTLRDY 0200 
2 #define IENABLE 0100 
3 #define 02 

4 #define 04 

5 #define 01 

6 define 


000000000 hbcom(0) «« 8 
| 001000000 IENABLE 
| 000000001 GO 
| 000xx0000 (rbp-»b xmem & 03) << 4 


001xx0001 


读 入 时 
001xx0001 
| 000000100 RCOM 


001xx0101 


写 入 时 


001xx0001 
| 000000010 WCOM 


001xx0011 





图 8-4 IAY RKCS 的 值 


rkintr() 


rkintr() 为 RK 磁盘 处 理 结束 时 引发 中 断 的 处 理 函 数 《〈 代 码 清单 8-13 
) 。 它 从 设备 处 理 队 列 删 除 位 于 头 部 的 缓冲 区 ， 并 再 次 执行 
rkstart()。 当 访问 RK 失败 时 进行 10 次 重 试 。 


对 于 已 结束 输入 输出 处 理 的 缓冲 区 来 说 ，B_DONE 标志 位 通过 iodone() 
设 定 。 异 步 访 问 时 ， 在 此 处 进行 释放 缓冲 区 的 处 理 。 


代码 清单 8-13 rkintr() (dmr/rk.c) 





register struct buf *bp; 


if (rktab.d active -- 0) 
return; 
bp = rktab.d actf; 
rktab.d active = 6; 
if (RKADDR-»rkcs < 0) ( 
deverror(bp, RKADDR-»rker, RKADDR-»rkds); 
RKADDR-»rkcs - RESET|GO; 
while((RKADDR-»rkcs&CTLRDY) -- 0) ; 
if (++rktab.d errcnt <= 10) ( 
rkstart(); 
return; 


} 
bp->b_flags =| B_ERROR; 


rktab.d errcnt = 60; 

rktab.d actf = bp-»av forw; 
iodone(bp); 

rkstart(); 





5^6 WR RK 磁盘 未 司 动 ， 则 不 直接 返回 。 
7 从 设备 处 理 队 列 取 得 位 于 头 部 的 绥 冲 区 。 
8 将 rktab.d active 重 置 为 0。 


9~18 WÈ RKCS 的 错误 位 (第 15 比特 位 ) 为 1， 则 进行 下 述 处 
理 。 





调用 deverror () 输出 错误 信息 
将 RESET 和 GO 赋予 RKCS， 使 磁盘 进行 Reset 处 理 


等 待 设置 RKCS 的 Ready 位 〈( 即 等 待 RK 磁盘 的 Reset 处 理 结 
R) 


递增 重 试 计数 器 


如 果 重 试 计数 器 的 值 小 于 等 于 10 则 重 试 ， 否 则 设置 
buf.b flags 的 错误 标志 位 


将 重 试 计 数 器 重 置 为 0。 

从 设备 处 理 队 列 删 除 位 于 涉 部 的 缓冲 区 。 

执行 iodone() 设置 缓冲 区 的 处 理 结束 标志 位 (B_DONE) 。 
执行 rkstart()， 开 始 处 理 设备 处 理 队列 的 下 一 个 缓冲 区 。 





RAW 输入 输出 

rkread() 和 rkwrite() 用 来 进行 RAW 输入 输出 。 这 两 个 函数 在 字符 
设备 驱动 表 中 注册 ， 使 RAW 输入 输出 使 用 的 缓冲 区 rrkbuf (代码 清 
单 8-14 ) 为 参数 ， 调 用 physio() 〈 代 码 清单 8-15 . 


代码 清单 8-14 rrkbuf (dmr/rk.c) 


1 struct buf rrkbuf; 


代码 清单 8-15 rkread(), rkwrite() ( dmr/rk.c) 





rkread(dev) 


physio(rkstrategy, &rrkbuf, dev, B READ); 


rkwrite(dev) 


8 physio(rkstrategy, &rrkbuf, dev, B WRITE); 





83 小结 

。 每 种 块 设备 都 具有 与 其 相对 的 块 设备 驱动 
。 块 设备 驱动 由 bdevsw[ ] 管理 

。 大 编号 对 应 bdevsw[ ] 的 数组 下 标 

。 块 设备 驱动 拥有 设备 处 理 队列 


第 V 部 分 文件 系统 

内 核 使 用 户 可 以 通过 文件 、 目 录 等 易于 理解 和 管理 的 概念 访问 块 设备 上 
的 数据 。 第 V 部 分 将 介绍 以 下 内 容 。 

e 如 何 使 用 块 设 备 上 的 区 域 

e 内 核 如 何 管理 块 设备 上 的 空 闪 区 域 

。 文件 的 实体 是 什么 

e 如 何 命 @ 并 管理 文件 

e 用 户 程序 如 何 操 作文 件 和 目录 


通过 阅读 本 部 分 的 内 容 ,对 读 写 文件 时 计算 机 内 部 发 生 的 处 理应 该 会 有 
比较 清晰 的 理解 。 


第 9 章 文件 系统 


9.1 什么 是 文件 系统 


文件 系统 是 结构 化 管理 块 设备 上 的 数据 的 机 制 。 它 通过 文件 和 目录 等 
概念 ， 使 管理 设备 上 的 数据 成 为 可 能 。 


文件 是 为 了 管理 块 的 集合 而 定义 的 概念 。 文 件 本 喘 通 过 文件 名 管理 。 为 
了 防止 文件 名 的 重复 ， 同 时 给 用 户 提供 方便 ，UNIX V6 采用 了 树 状 结 
构 的 命名 空间 。 目 录 通 过 文件 名 管理 文件 ， 它 在 本 质 上 是 与 文件 相同 的 
人 


由 于 存在 文件 系统 ， 用 户 无 需 对 块 设备 的 种 类 、 规 格 、 数 据 的 存放 地 址 
等 复杂 信息 有 任何 了 解 。 


在 利用 块 设备 的 文件 系统 前 需要 对 其 进行 挂 载 (mount) o BEER T 
多 个 块 设备 的 文件 系统 ， 对 用 户 而 言 也 是 透明 的 ， 在 数据 操作 方面 并 无 
任何 不 同 (图 9-1 ) 。 
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图 9-1 文件 系统 
inode 


文件 用 来 管理 块 设备 上 的 块 集合 ， 它 由 两 部 分 构成 ， 定 义 文件 的 inode 
和 该 文件 包含 的 数据 。inode 管理 文件 大 小 、 访 问 权 限 、 保 存 数据 的 块 
设备 的 块 编写 等 信息 。 操 作文 件 时 ， 系 统 内 核 需 要 首先 取得 对 象 文件 的 


inode。 


inode 本 里 也 保存 在 块 设备 中 。 系 统 内 核 将 inode 从 块 设备 读 取 至 内 存 
时 ， 为 了 便于 操作 ， 对 其 格式 进行 了 适当 的 改变 。 虽 然 在 阅读 内 核 代 码 
时 着 重 考 虑 内 存 中 inode 的 格式 即 可 ， 但 应 该 注意 到 它 被 写 回 块 设备 

时 ， 其 数据 格式 古 不 同 的 ， 请 不 要 起 记 这 一 反 。 


树 状 结构 的 命名 空间 

系统 利用 树 状 结构 的 命名 空间 赋予 文件 唯一 的 文件 名 。 文 件 和 目录 可 以 
通过 以 根 目录 为 起 点 的 绝对 路 径 ， 或 以 当前 目录 为 起 点 的 相对 路 径 指 
Eo 


将 位 于 树 状 结构 顶点 的 目录 称 为 根 目录 。 由 光 起 始 的 路 径 为 绝对 路 径 。 




















进程 当前 所 在 的 目录 称 为 当前 目录 ， 用 user.u cdin 表示 。 如 果 路 径 
的 起 始 字符 为 光 以 外 的 字符 ， 则 为 相对 路 径 。 另 外 ，“… 表 示 对 象 目录 本 
身 ，“… 表 示 对 象 目录 的 父 目 录 《〈 图 9-2 ) 。 


<D Bx 
L] X3 


绝对 目录 名 : /dir1/dir2/file 
相对 目录 名 : dir2/file 





图 9-2 树 状 结构 的 命名 空间 


挂 载 


块 设备 的 文件 系统 通过 挂 载 操作 被 系统 识别 ， 反 之 ， 将 其 从 系统 中 解除 
的 操作 即 为 外 载 。 利 用 挂 载 和 番 载 ， 用 户 可 以 将 多 个 块 设 备 的 文件 系 
统 ， 根 据 需要 上 自由 地 追加 到 系统 中 ， 或 从 系统 中 解除 。 


为 了 进行 挂 载 ， 首 先 需 要 生成 与 块 设 备 相 对 的 特殊 文件 〈special 

file ， 并 利用 系统 调用 mount 将 该 文件 与 挂 载 点 (mount point) 进行 
关联 。 所 谓 挂 载 点 其 实 是 一 个 路 径 ， 被 挂 载 的 块 设 备 的 文件 系统 将 以 访 
路 径 为 起 点 。 已 经 被 挂 载 的 块 设备 〈 的 文件 系统 ) 由 mount [ ] 管理 。 


访问 权限 


登录 到 系统 的 用 户 补 赋予 用 户 ID。 如 果 用 户 生 成 了 文件 ， 用 户 ID 和 该 
用 户 所 属 的 组 (group) 的 ID 将 会 被 记录 在 文件 里 。 


文件 的 访问 权限 通过 一 组 长 度 为 11 比特 的 数据 〈 称 为 权限 设 定 ， 
permission) 管理 ， 其 中 的 9 比特 分 别 对 文件 的 所 有 者 、 所 有 者 所 属 组 
的 用 户 以 及 其 他 用 户 的 读 写 和 执行 权限 做 了 定义 〈 表 9-1 ) 。 因 为 上 述 
各 类 用 户 的 权限 均 以 3 比特 表示 ， 所 以 文件 的 访问 权限 经 常 写 成 0644 
或 0755 这 样 的 八进制 的 形式 。 


表 9-1 权限 设 定 





























有 者 是 否 可 写 

















久 件 拥有 者 是 否 可 以 执行 




















有 者 所 属 组 是 否 可 读 
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上 有 者 所 属 组 是 否 可 以 执行 




















j 户 是 否 可 以 执行 








权限 设 定 余下 的 2 比特 中 ， 有 1 比特 称 为 SUID。 当 它 被 置 为 1 时 ， 在 
文件 执行 时 用 户 ID 将 暂时 设置 为 文件 拥有 者 的 用 户 ID。 男 有 1 比特 称 
为 SGID， 当 它 被 置 为 1 时 ， 在 文件 执行 时 组 ID 将 暂时 设置 为 文件 拥有 
者 所 属 组 的 ID。 


user 结构 体 的 u_uid fllu ruid 用 来 管理 进程 的 用 户 ID, u. gid 和 

u rgid 用 来 管理 组 ID。SUID 和 SGID 的 值 为 1 时 ， 在 程序 运行 时 
u_uid 和 u_gid 将 改变 ， 而 u_ruid 和 u_rgid 则 维持 原状 。 

此 ，u_uid、u_gid 被 称 为 实效 用 户 ID 和 实效 组 ID，u_ruid、u_rgid 
则 被 称 为 实际 用 户 ID 和 实际 组 ID. 


user.u uid 为 0 的 进程 称 为 超级 用 户 。 超 级 用 户 可 以 忽略 权限 设 定 操 
作 所 有 文件 。 但 是 如 果 希 望 执 行 某 个 文件 ， 必 须 事 先 对 文件 拥有 者 、 所 
属 组 、 其 他 用 户 的 其 中 之 一 赋予 可 执行 该 文件 的 权限 。 


正 因 为 对 文件 和 目录 采用 了 树 状 结构 进行 管理 ， 权 限 管理 也 相应 变 得 容 
易 。 比 如 说 ， 可 以 很 方便 地 指定 除了 录 个 用 户 以 外 的 所 有 用 户 不 得 访问 
菏 个 目录 。 假 设 没有 采用 树 状 结构 进行 管理 的 话 ， 八 怕 只 能 对 每 个 文件 
手动 设置 访问 权限 。 


根 磁盘 


对 系统 而 言 需要 定义 一 个 根 磁盘 。 根 磁盘 的 文件 系统 在 月 动 时 科目 动 导 
入 系统 ， 它 保存 了 系统 内 核 程 序 和 用 于 控制 系统 的 用 户 程序 
(/etc/init 等 ) ， 这 些 程序 将 在 系统 局 动 时 执行 。 根 磁盘 以 外 的 块 设 
备 的 文件 系统 可 在 启动 后 挂 载 。 


根 磁盘 通过 rootdev 来 指定 。 系 统管 理 者 需要 根据 实际 情况 更 改 
rootdev 的 设 定 ， 并 重新 生成 系统 内 核 。 代 码 清 单 9-1 的 例子 中 将 
rootdev 的 大 编写 和 小 编写 同时 设 定 为 0。 如 果 bdevsw[ ] 按照 代码 清 
单 8-2 设置 ， 那 么 小 编号 为 0 的 RK 磁盘 (驱动 器 ) 将 成 为 根 磁 盘 。 


代码 清单 9-1 rootdev (conf.c) 














1 int rootdev ((0««8) |0) ; 


9.2 块 设备 的 区 域 
块 设备 被 分 为 4 个 区 域 。 编 号 为 0 的 块 将 在 系统 启动 时 投入 使 用 。 编 号 
为 工 的 块 称 为 超级 块 〈superblock) ， 它 包含 了 该 设备 的 信息 。 其 后 依 
次 为 inode 区 域 和 存储 区 域 。inode 区 域 和 存储 区 域 的 大 小 由 超级 块 定 
X. (图 9-3)。，。 
块 设备 
RF 


2 
ni 


存储 区 域 数据 


inode 区 域 和 存储 区 域 
的 长 度 由 超级 块 设 定 





图 9-3 Sud p 


当 系 统管 理 者 执行 用 户 程序 /etc/mkfs 时 ， 将 对 块 设备 的 各 区 域 进行 
初始 化 处 理 。 


用 于 局 动 的 区 域 


编写 为 0 的 块 在 系统 局 动 时 投入 使 用 ， 而 在 其 他 的 情况 下 不 会 被 使 用 。 
详细 请 参照 第 14 章 。 


超级 块 








编号 为 1 的 块 容纳 着 超级 块 的 信息 。 超 级 块 对 相应 块 设备 的 信息 进行 管 
理 ， 用 于 获取 资源 及 排他 处 理 。 此 外 ， 超 级 块 通过 空闲 队列 〈free lis 
管理 未 使 用 的 inode 和 属于 未 使 用 存储 区 域 的 块 。 新 生成 文件 时 ， 内 核 
从 空闲 队列 获取 未 使 用 区 域 的 信息 。 反 之 ， 当 删除 文件 时 ， 将 文件 占用 
We 
清单 9-2， 表 9-2 ) 。 


代码 清单 9-2 filsys 结构 体 filsys.h) 





truct filsys 


S 
{ 


int s_isize; 

int s fsize; 

int s nfree; 

int s free[100]; 
int s ninode; 
int s inode[100]; 
char 

char 

char 

char 

int s time[2]; 
int pad[50]; 








s ninode inode 空 闪 队列 中 的 有 效 元 素 个 数 


存储 空闲 队列 的 锁 
inode 空 闪 队列 的 锁 





当前 块 设备 为 只 读 
当前 时 刻 ， 或 最 后 更 新 时 刻 


















































1 这 里 的 原文 有 误 。s _ fsize 指 的 应 该 是 块 设备 全 体 〈 包 括 编号 为 0 的 块 ， 超 级 块 ，inode 
区 域 和 存储 区 域 ) 的 块 数 。 一 一 译 者 注 























inode [X 35 


从 编号 为 2 的 块 开始 是 长 度 为 filsys.s_isize 个 块 的 inode 区 域 。 
inode 区 域 用 来 保存 inode。inode 中 有 文件 的 定义 ，1 个 inode 对 应 1 个 
双人 


inode 具有 编写 。 从 位 于 inode 区 域 起 始 位 置 的 inode 开始 ， 依 次 
赋予 1、2、3...... 的 编号 。inode 的 长 度 为 32 字 节 ，1 个 块 (512 6 
W) 可 容纳 个 inode。 具 有 某 个 inode 编号 的 inode 所 在 的 块 可 表示 
为 (inode 编号 +31 ) /16( 同 下 取 整 ，， 块 中 的 偏 移 量 可 表示 为 

32x ( (inode 编号 +31 ) %16 ) (图 9-4 ) 。 





块 设备 1 个 块 =512 字 节 1 个 inode=32 字 节 偏 移 量 


0 启动 区 域 
| o 
1 超级 块 ; 


2 "o 
inode [X 1s f 


| 
[x 13 


例如 ，inode 编号 为 18 的 inode， 位 于 (18431) /16= 第 3 个 块 
的 第 32 x (( 18+31 ) %16 ) 232 个 字 节 处 


图 9-4 inode [X Ji 


块 设备 中 inode 的 数据 形式 由 ino.h 中 的 inode 结构 体 定义 (代码 清 
单 9-3， 表 9-3 ) 。 该 结构 体 包 括 文件 长 度 、 权 限 、 更 新 时 间 、 数 据 所 
在 地 址 等 数据 。 请 注意 ，inode 中 不 包含 文件 名 。 


如 前 所 述 ， 内 存 中 inode 的 数据 形式 稍 有 不 同 。 内 存 中 的 inode 由 
inode.h 中 的 inode 结构 体 定义 ， 详 细 请 参照 后 文 。 内 核 不 会 使 用 
ino.h 中 定义 的 inode 结构 体 ， 而 一 部 分 对 文件 系统 进行 操作 的 用 户 
程序 将 使 用 该 结构 体 。 






代码 清单 9-3 inode 结构 体 Cino.h) 





1 struct inode 

21 

3 int i mode; 
4 char i nlink; 
5 char i uid; 

6 char i gid; 

7 char i sizee; 


8 char X *i sizel; 


9 int i addr[8]; 
10 int i atime[2]; 
11 int i mtime[2]; 
12 }; 

13 


14 /* modes */ 

15 &sdefine IALLOC 0100000 
16 #define IFMT 060000 
17 &define IFDIR 040000 
18 #define IFCHR 020000 
19 &sdefine IFBLK 060000 
20 #define ILARG 010000 
21 #define ISUID 04000 
22 #define ISGID 02000 
23 #define ISVTX 01000 
24 #define IREAD 0400 
25 #define IWRITE 0200 
26 #define IEXEC 0100 





K 9-3 inode 结构 体 

















| 





文件 长 度 的 高 位 8 比特 
文件 长 度 的 低位 16 比特 


i addr[] 使 用 的 存储 区 域 的 块 编号 








参照 时 间 。 inode.h 中 的 inode 结构 体 不 包含 此 成 员 











更 新 时 间 。 inode.h 中 的 inode 结构 体 不 包含 此 成 员 


表 9-4 inode 的 模式 
































文件 长 度 较 大 ， 使 用 间接 参照 


IWRITE 写 入 权限 











存储 区 域 


存储 区 域 位 于 inode 区 域 后 方 ， 其 长 度 由 filsys.s_fsize* 定义 。 存 
储 区 域 保 存 着 文件 中 的 数据 。 


2 


























这 里 的 原文 有 误 。 请 参照 p190 的 译 者 注 。 一 一 译 者 注 








inode.i addr[] 表示 某 个 文件 究竟 使 用 着 存储 区 域 的 哪 一 个 块 。 文 件 
使 用 的 块 不 一 定 是 连续 的 ， 但 是 从 用 户 的 角度 来 看 ， 文 件 可 以 被 看 做 是 
占用 了 一 块 连续 的 区 域 (图 9-5 ) 。 


存储 区 域 


该 文件 数据 
inode.i_addr[ ] 占用 的 块 


某 个 文件 的 inode 





图 9-5 inode 和 存储 区 域 


93 ER 
mount 结构 体 


被 挂 载 的 块 设备 〈 的 文件 系统 ) 通过 mount 结构 体 的 数组 mount [ ] 进 
行 管理 〈 代 码 清 单 9-4， 代 码 清单 9-5， 表 9-5 ) 。 


挂 载 块 设备 的 文件 系统 之 后 ， 将 被 分 配 新 的 mount[ ] 的 元 素 。 将 
mount.m dev 设 定 为 该 块 设备 的 设备 编号 ， 代 表 挂 载 点 的 inode[ ] 元 
z& (inode[] 用 于 管理 读 取 至 内 存 的 ipode。 详 细 请 参见 下 文 ) 通过 
mount.m inodep 指定 。 设 置 代 表 挂 载 点 的 inode[] 元 素 的 IMOUNT 标 
志 人 位， 表示 该 元 素 为 挂 载 点 。 此 外 ， 超 级 块 的 数据 拷贝 公 NODEV 块 设 
备 缓冲 区 ， 通 过 mount.m bufp 可 访问 该 缓冲 区 。 

内 核 在 遍历 文件 路 径 时 ， 如 果 遇 到 挂 载 点 ， 将 取得 相应 的 mount[ ] 元 
素 ， 然 后 移动 到 被 挂 载 的 块 设备 的 根 目 录 。mount[] 用 于 关联 挂 载 点 和 
被 挂 载 的 设备 (图 9-6 ) 。 


代码 清单 9-4 mount (system.h) 





struct mount 
{ 


int m dev; 


int *m inodp; 


1 
2 
3 
4 int *m bufp; 
5 
6 } mount[NMOUNT ] ; 





代码 清单 9-5 NMOUNT (param.h) 


1 #define NMOUNT 5 


43€ 9-5 mount 结构 体 


m dev 被 挂 载 的 块 设备 的 设备 编号 





指向 块 设备 缓冲 区 的 指针 ， 该 缓冲 区 容纳 着 被 复制 的 超级 块 的 数据 





*m inodp | 代表 挂 载 点 的 inode[] 元 素 


inode.i flag: IMOUNT 块 设备 1 









a 
2. 


2" 块 设备 2 


块 设备 2 的 根 目录 


mountl] 


这 两 个 对 象 通过 
mount[] 进行 关联 


图 9-6 ER 


系统 调用 mount 


系统 调用 mount H FERH, JF mount[] 元 素 妃 加 块 设备 的 信 
Eo RAH mount 具有 3 个 参数 ， 分 别 为 与 挂 载 设备 对 应 的 特殊 文 
件 的 路 径 、 挂 载 点 的 路 径 和 读 写 标志 。 


系统 调用 首先 检查 特殊 文件 的 路 径 是 否 恰当 ， 此 处 理 调用 getmdev(). 
如 果 路 径 恰 当 则 返回 设备 编号 。 此 外 ， 确 认 挂 载 点 当前 没有 任何 人 访 
问 ， 并 确认 不 是 字符 设备 的 特殊 文件 。 


此 后 ， 从 mount[] 中 寻找 空 的 元 素 ， 并 对 该 元 素 进 行 初始 化 处 理 。 然 
后 为 代表 挂 载 点 的 inode[ ] 元 素 设置 IMOUNT 标志 位 。 








smount() 是 系统 调用 mount 的 处 理 函 数 (Xe 9-6， 代 码 清单 9-6 ) . 
表 9-6 系统 调用 mount 的 参数 


成 员 


与 挂 载 设备 相对 应 的 特殊 文件 的 路 径 








读 写 标志 。 如 果 为 1， 表 示 以 只 读 方 式 挂 载 


代码 清单 9-6  smount()(ken/sys3.c) 











1 

2 

3 int d; 

4 register *ip; 

5 register struct mount *mp, *smp; 
6 extern uchar; 

7 

8 d = getmdev(); 

9 if(u.u error) 
10 return; 
11 u.u dirp = u.u arg[1]; 
12 ip = namei(&uchar, 0); 
13 if(ip -- NULL) 

14 return; 

15 if(ip-»i count!-1 || (ip-»i mode&(IFBLK&IFCHR))!-0) 
16 goto out; 

17 smp - NULL; 

18 for(mp = &mount[0]; mp < &mount[NMOUNT]; mp++) { 
19 if(mp-»m bufp !- NULL) ( 

20 if(d == mp-»m dev) 

21 goto out; 

22 ) else 

23 if(smp -- NULL) 

24 smp - mp; 

25 } 


26 if(smp == NULL) 


27 goto out; 


28 (*bdevsw[d.d major].d open)(d, !u.u arg[2]); 
29 if(u.u error) 

30 goto out; 

31 mp - bread(d, 1); 

32 if(u.u error) ( 

33 brelse(mp); 

34 goto out1; 

35 } 

36 smp->m_inodp = ip; 

37 smp-»m dev = d; 

38 smp-»m bufp - getblk(NODEV); 
39 bcopy(mp-»b addr, smp-»m bufp-»b addr, 256); 
40 smp - smp-»m bufp-»b addr; 

41 smp-»s ilock - 6; 

42 smp-»s flock - 6; 

43 smp-»s ronly - u.u arg[2] & 1; 
44 brelse(mp); 

45 ip-»i flag -| IMOUNT; 

46 prele(ip); 

47 return; 

48 

49 out: 

50 u.Uu error = EBUSY; 

51 out1: 

52 iput(ip); 

53 ) 





8-10 ”执行 getmdev() 取得 准备 挂 载 的 块 设 备 的 大 编号 。 
11~14 取得 代表 挂 载 点 的 inode[ ] WK. 


15~16 ”确认 无 人 访问 代表 挂 载 点 的 inode[] 元 素 ， 同 时 确认 该 元 
素 不 为 字符 设备 或 块 设备 的 特殊 文件 。 


17-27 寻找 mount[] 中 未 使 用 的 元 素 。 如 果 不 存 在 未 使 用 元 素 ， 
或 者 准备 挂 载 的 设备 已 被 挂 载 ， 则 认为 出 错 。 


28-30 ”进行 打开 挂 载 设 备 的 处 理 。 
31-35 ”将 挂 载 设备 的 超级 块 读 入 绥 冲 区 。 
36-43 ”对 所 取得 的 mount[] 元 素 进行 初始 化 处 理 。 通 过 


getblk() 取得 尚未 分 配给 任何 设备 的 块 设备 缓冲 区 。 将 挂 载 设备 
的 超级 块 的 数据 复制 到 该 缓冲 区 ， 并 注册 到 mount[] 元 系 。 


44 释放 读 取 超 级 块 的 缓冲 区 。 

45 设置 代表 挂 载 点 的 inode[ ] 元 素 的 IMOUNT 标志 位 。 

46 解除 代表 挂 载 点 的 inode[ ] 元 素 的 锁 。 
getmdev() 
getmdev() 是 执行 smount() 和 sumount() 共用 处 理 的 函数 (代码 清 
单 9-7 ) 。 该 函数 首先 检查 作为 系统 调用 第 1 个 参数 的 特殊 文件 的 路 径 
是 否 合适 ， 如 果 合 适 ， 则 返回 该 设备 的 设备 编号 。 


代码 清单 9-7 getmdev() (ken/sys3.c) 





etmdev() 


register d, *ip; 
extern uchar; 


ip = namei(&uchar, 0); 
if(ip -- NULL) 
return; 


if((ip-»i mode&IFMT) !- IFBLK) 
u.u error = ENOTBLK ; 

d = ip-»i addr[0]; 

if(ip-»i addr[0].d major >= nblkdev) 
u.Uu error = ENXIO; 

iput(ip); 

return(d); 





6-8 ”取得 与 用 户 输 入 的 第 1 个 参数 的 路 径 相 对 应 的 inode] 元 


Ao 


9~10 ”如 果 不 为 块 设备 的 特殊 文件 则 出 错 。 
11 特殊 文件 的 inode.i_addr[0] 中 保存 着 设备 编号 。 


12413 ”如 有 果 设 备 的 大 编写 的 值 过 大 则 出 错 。 

14~15 释放 inode[] 元 素 ， 返 回 设备 编号 。 
系统 调用 umount 
系统 调用 umount 用 于 缉 载 指定 块 设备 的 文件 系统 。 它 从 mount [ ] 中 释 
放 相 应 元 素 ， 并 清除 代表 挂 载 点 的 inode[] 元 素 的 IMOUNT 标志 位 。 但 
是 ， 如 果 准 备 旨 载 的 设备 仍 处 于 使 用 中 的 状态 ， 则 中 断 缀 载 处 理 。 


sumount () 为 系统 调用 umount 的 处 理 函 数 〈 表 9-7， 代 码 清单 9-8 
) 。 系 统 调 用 umount 的 参数 为 挂 载 点 的 路 径 。 


K 9-7 系统 调用 umount 的 参数 


参数 


代码 清单 9-8 sumount() (ken/sys3.c) 








1 sumount() 

2 { 

3 int d; 

4 register struct inode *ip; 

5 register struct mount *mp; 

6 

7 update(); 

8 d = getmdev(); 

9 if(u.u error) 

10 return; 

11 for(mp = &mount[0]; mp « &mount[NMOUNT]; mp++) 
12 if(mp-»m bufpl-zNULL && d--mp-»m dev) 
13 goto found; 

14 u.u error - EINVAL; 

15 return; 

16 

17 found: 


18 for(ip = &inode[0]; ip « &inode[NINODE]; ip++) 


19 if(ip-»i number!-0 && d--ip-»i dev) { 


20 u.u error = EBUSY; 
21 return; 

22 } 

23 (*bdevsw[d.d major].d close)(d, 0); 
24 ip = mp-»m inodp; 

25 ip-»i flag =& -IMOUNT; 

26 iput(ip); 

27 ip = mp-»m bufp; 

28 mp-»m bufp - NULL; 

29 brelse(ip); 

30 ) 





7. ” 凶 载 前 先 将 内 存 中 的 数据 保存 至 块 设备 。 


8-10 ”取得 准备 印 载 的 设备 的 设备 编号 。 
11~15 在 mount[] 中 寻找 与 全 载 设备 相对 应 的 元 素 。 


18-22 在 inode[] 中 寻找 属于 番 载 设备 的 元 素 。 如 采 存 在 则 说 明 
该 设备 仍 处 于 使 用 中 的 状态 ， 此 时 将 终止 由 载 处 理 。 


23 ”进行 关闭 撮 载 设备 的 处 理 。 


24~26 ”清除 与 挂 载 点 相对 的 inode[] 元 素 的 IMOUNT 标志 位 ， 并 
释放 该 元 素 。 


27-28 释放 mount[] 元 素 。 


29 释放 块 设备 缓冲 区 ， 该 缓冲 区 容纳 着 被 外 载 设备 的 超级 块 的 数 
PE o 


9.4 inode 的 获取 和 释放 
inode[] 


内 存 中 的 inode 通过 inode 结构 体 的 数组 inode[] 管理 (代码 清单 9- 
9， 代 码 清单 9-10， 表 9-8 ) 。 此 处 的 inode 结构 体 由 inode.h 定义 ， 
代表 被 读 取 至 内 存 的 inode 的 数据 结构 。 


内 核 从 块 设备 读 取 inode 的 数据 并 将 其 转换 为 inode[ ] 数组 元 素 的 形 

式 ， 通 过 操作 该 元 素 实现 对 inode 的 操作 。inode[ ] 元 素 以 设备 编号 和 

inode 编号 进行 命名 。 所 有 块 设备 的 inode 由 同一 个 inode[] 管理 。 此 

inode[] 元 素 通 过 参照 计数 器 来 记录 该 元 素 是 否 处 于 使 用 中 的 状态 
(图 9-7 ) 。 





周边 设备 


块 设备 1 ( 设备 编号 =devA ) 
inodel] ! 的 inode 区 域 
i 


内 核对 inodel] 元 素 
进行 操作 






块 设备 2 ( 设备 编号 =devB ) 
的 inode 区 域 


inode 编号 3 





图 9-7 inodel] 


inode[] 可 以 起 到 缓存 的 作用 。inode[] 中 的 某 个 元 素 即 使 不 再 使 用 也 
不 会 马上 被 删除 。 在 该 元 素 再 次 被 其 他 inode 使 用 之 前 ， 其 数据 仍然 保 
存在 inode[] 中 。 因 此 ，inode[] 中 保存 着 当前 正在 使 用 的 inode， 以 
及 最 近 曾 经 使 用 过 的 inode 的 数据 。 当 所 需 的 inode 在 inode[] 中 存在 
时 ， 无 需 再 从 块 设备 中 读 取 。 


此 外 ， 通 过 对 inodef[ ] 元 系 进 行 排他 处 理 ， 可 以 防止 多 个 进程 操作 同 
一 文件 时 引发 的 冲突 。 





代码 清单 9-9 inode Cinode.h) 


struct inode 


( 


char i flag; 


1 
2 
3 
4 char i count; 
5 int i dev; 
6 int i number; 
7 int i mode; 
8 char i nlink; 
9 char i uid; 
10 char i gid; 
11 char i size; 
12 char *i sizel; 
13 int i addr[8]; 
14 int i lastr; 

) inode[NINODE]; 
16 
17 /* flags */ 
18 #define ILOCK 
19 #define IUPD 
20 #define IACC 
21 &define IMOUNT 
22 #define IWANT 
23 #define ITEXT 
24 
25 /* modes */ 
26 #define IALLOC 0100000 
27 #define IFMT 060000 
28 #define IFDIR 040000 
29 #define IFCHR 020000 
30 #define IFBLK 060000 
31 #define ILARG 010000 
32 #define ISUID 04000 
33 #define ISGID 02000 
34 #define ISVTX 01000 
35 #define IREAD 0400 
36 #define IWRITE 0200 
37 #define IEXEC 0100 





代码 清单 9-10 NINODE (param.h) 


1 #define NINODE 100 


K 9-8 inode 结构 体 























示 志 。 人 参照 表 9-9. Æ ino.h 中 定义 的 inode 结构 体 中 不 存在 此 成 员 





定义 的 inode 结构 体 中 不 存在 此 成 员 

















设备 编号 。 在 ino.h 中 定义 的 inode 结构 体 中 不 存在 上 


























P 。0 表示 未 使 用 的 元 素 。 在 ino.h 中 定义 的 inode 结构 体 中 不 存在 
W 


空 制 信息 。 低 位 9 比特 表示 权限 。 参 照 表 9-4 



































文件 长 度 的 高 位 8 比特 
文件 长 度 的 低位 16 比特 
使 用 的 存储 区 域 的 块 编号 


1 在 此 之 前 读 取 的 逻辑 块 编号 。 用 于 预 读 取 功 能 。 在 ino.h 中 定义 的 inode 结 
构 体 中 不 存在 此 成 员 

















表 9-9 inode 的 标志 位 








存在 等 待 解锁 该 inode[] 元 素 的 进程 





iget() 
iget() 用 于 取得 inode[] 元 素 〈 表 9-10， 代 码 清 单 9-11 ) 。 


"WR inode[] 中 不 存在 所 需要 的 元 系 ， 则 获取 新 的 元 素 并 命名 ， 然 后 
将 从 块 设备 读 取 的 inode 的 数据 复制 到 上 述 新 元 素 ， 并 返回 该 元 素 。 


WÑ inode[] 中 存在 所 需要 的 元 素 ， 递 增 参 照 计数 吉 并 退回 该 元 素 。 
由 于 无 需 读 取 块 设备 处 理 速度 也 相应 提高 。 但 是 如 果 该 元 素 处 于 被 加 锁 
的 状态 ， 则 进入 睡眠 状态 直到 元素 被 解锁 。 


如 果 设 置 了 inode[ ] 元 素 的 IMOUNT 标志 位 ， 则 取得 mount[ ] 元 素 ， 
并 返回 与 对 应 设备 的 根 目录 相对 应 的 inode[ ] 元 素 。 通 过 该 处 理 ， 使 
得 利用 同一 命名 空间 管理 多 个 挂 载 设备 成 为 可 能 。5 











3 即使 得 在 同一 个 目录 树 下 同时 载 入 多 个 挂 载 设备 的 根 目录 成 为 可 能 。 审 校 者 注 











K 9-10 iget() 的 参数 





代码 清单 9-11 iget() (ken/iget.c) 





get(dev, ino) 


1i 

2í1 

3 register struct inode *p; 
4 register *ip2; 

5 int *ip1; 

6 register struct mount *ip; 
7 

8 

9 


loop: 
ip = NULL; 
10 for(p = &inode[0]; p < &inode[NINODE]; p++) { 
11 if(dev--p-»i dev && ino--p-»i number) { 
12 if((p-»i flag&ILOCK) !- 0) ( 
13 p-»i flag -| IWANT; 
14 sleep(p, PINOD); 
15 goto loop; 
16 } 
17 if((p-»i flag&IMOUNT) != 0) ( 
18 for(ip = &mount[0]; ip « &mount[NMOUNT]; ip++) 
19 if(ip-»m inodp -- p) ( 
20 dev - ip-»m dev; 
21 ino - ROOTINO; 
22 goto loop; 
23 } 
24 panic("no imt"); 
25 } 
26 p-»i count++; 
27 p-»i flag =| ILOCK; 
28 return(p); 
29 } 
30 if(ip--NULL && p-»i count--0) 


31 ip = p; 


32 } 

33 if((p=ip) == NULL) { 

34 printf("Inode table overflow\n"); 
35 u.u error = ENFILE; 

36 return(NULL); 

37 } 

38 p-»i dev = dev; 

39 p-»i number - ino; 

40 p-»i flag - ILOCK; 

41 p-»i count; 

42 p-»i lastr = -1; 

43 ip = bread(dev, ldiv(ino431,16)); 
44 if (ip-»b flags&B ERROR) { 

45 brelse(ip); 

46 iput(p); 

47 return(NULL); 

48 } 

49 ip1 = ip->b addr + 32*lrem(ino+31, 16); 
50 ip2 - &p-»i mode; 

51 while(ip2 < &p-»i addr[8]) 

52 *ip2- = *ip1++; 

53 brelse(ip); 

54 return(p); 

55 ) 





10 ”从 起 始 位 置 遍历 inode[]， 寻 找 未 使 用 的 元 素 。 同 时 确认 对 象 
元 素 是 否 在 inode[] 中 已 存在 。 


11 找到 与 参数 dev. ino 相对 应 的 元 素 时 的 处 理 。 


12-16 ”如 果 对 象 元 素 被 加 锁 ， 则 设置 IWANT 标志 位 (表示 存在 等 
待 该 inode[] 元 素 的 进程 ) 并 进入 睡眠 状态 。 唤 醒 后 返回 loop 再 
次 尝试 。 


17-25 如果 设置 了 IMOUNT 标志 位 ， 则 从 mount[] 找到 对 应 的 元 
素 ， 将 dev 设 定 为 被 挂 载 设 备 的 设备 编号 ， 将 ino 设 定 为 
ROOTINO (1) ， 然 后 返回 loop 并 再 次 尝试 。ROOTINO 表示 根 目录 
的 inode 编号 〈 代 码 清 单 9-12) 。 

代码 清单 9-12 ROOTINO (param.h) 


1 #define ROOTINO 1 


| E 


26-28 ”如 果 对 象 元 素 既 未 被 加 锁 ， 也 没有 设置 IMOUNT 标志 位 的 
话 ， 递 增 该 元 素 的 参照 计数 器 并 加 锁 ， 然 后 返回 该 元 素 。 


30-31 将 inode[] 中 距 起 始 位 置 最 近 的 未 使 用 元 素 赋 予 ip。 


33~37 ”如 果 在 inode[] 中 未 找到 与 参数 dev. ino 相对 应 的 元 
x, Hinode[] 中 不 存在 未 使 用 元 素 时 ， 按 出 错 处 理 。 


38-42 ”为 inode[] 中 未 使 用 的 元 素 命 名 。 递 增 参 照 计 数 器 并 对 该 
元 素 加 锁 《〈 同 时 清除 其 他 标志 位 ) ， 然 后 将 预 读 取 逻辑 块 编 号 设置 
为 -1 (无 效 ) 。 

43” 读 取 块 设备 中 该 inode 所 在 的 块 。 

44-48 在 读 取 块 设备 发 生 错误 时 进行 错误 处 理 。 


49~52 ”将 块 设备 中 inode 的 i_mode 至 i_addr 数据 复制 到 
inode[ ] 元 素 。 


53~54 释放 缓冲 区 ， 返 回 inode[] 元 素 。 

iput() 

iput() 用 来 递减 inodef[ ] 元 素 的 参照 计数 器 的 值 CK 9-11， 代 码 清单 
9-13) 。 当 参照 计数 器 的 值 为 0 时 ， 将 inode[ ] 元 素 的 内 容 写 回 块 设 
备 。 此 外 ， 当 文件 不 再 被 任何 目录 参照 时 进行 删除 文件 的 处 理 。 

文件 的 删除 处 理 包 含 以 下 内 容 。 

。 执 行 itrunc()， 释 放 使 用 中 的 存储 区 域 ， 将 文件 长 度 和 


inode.i addr[] 清 0 


。 将 inode.i mode 清 0 





。 执 行 ifree(). 将 inode 编号 返还 至 空闲 队列 
K 9-11 iput() 的 参数 





代码 清单 9-13 iput() (ken/iget.c) 


1 iput(p) 
2 struct inode *p; 


register *rp; 


rp = p; 
if(rp->i_count == 1) { 
rp->i_flag =| ILOCK; 
if(rp-»i nlink <= 0) 
itrunc(rp); 
rp-»i mode - 6; 


ifree(rp-»i dev, rp-»i number); 


} 
iupdat(rp, time); 
prele(rp); 
rp-»i flag = 0; 
rp-»i number = 6; 
} 
rp-»i count--; 
prele(rp); 





7 递减 inode[ ] 元 素 参 照 计数 器 的 值 ， 使 其 变 为 0 时 的 处 理 。 
8 将 inode[] 元 素 加 锁 。 

9-13 ” 当 文 件 不 再 被 任何 目录 参照 时 进行 删除 文件 的 处 理 。 

14 将 inode[] 元 素 的 数据 写 回 块 设备 。 

15 将 inode[] 元 素 解锁 。 


16~17 将 inode[] 元 素 的 i_flag 和 i_number 清 0。 


19 ”递减 参照 计数 器 的 值 。 

20 将 inode[] 元 素 解 锁 。 这 是 针对 在 iput() 之 外 加 锁 的 处 理 。 
iupdat() 
uns 将 inode[] 元 素 的 内 容 写 入 块 设备 ( 表 9-12， 代 码 清单 9-14 

。 写 入 处 理 只 在 设置 了 inodef[ ] 元 素 的 更 新 标志 位 〈IUPD) 或 参照 
ERIS 


K 9-12 iupdat() 的 参数 





^ 


含义 








代码 清单 9-14 iupdat() (ken/iget.c) 





1 iupdat(p, tm) 
2 int *p; 
3 int *tm; 


4 1 
5 register *ip1, *ip2, *rp; 
6 int *bp, i; 

7 

8 


rp-p; 
9 if((rp-»i flag&(IUPD|IACC)) != 0) ( 
10 if(getfs(rp-»i dev)-»s ronly) 
11 return; 
12 i = rp-»i number-431; 
13 bp = bread(rp-»i dev, ldiv(i,16)); 
14 ip1 = bp-»b addr + 32*lrem(i, 16); 
15 ip2 = &rp-»i mode; 
16 while(ip2 < &rp-»i addr[8]) 
17 *ipl++ = *ip2++; 
18 if(rp->i_flag&IACC) { 


19 *ipl1++ = time[0]; 


20 *iplr- = time[1]; 


21 ) else 

22 ipl =+ 2; 

23 if(rp-»i flag&IUPD) { 
24 *iplr- = *tm++; 
25 *ipl1++ = *tm; 

26 } 

27 bwrite(bp); 

28 

29 ) 





9 更 新 标志 位 或 设置 参照 标志 位 时 的 处 理 。 
10-11 执行 getfs() 读 取 超 级 块 ， 如 果 为 只 读 则 直接 返回 
12~13 ”从 块 设备 中 读 取 inode 所 在 的 块 。 


14~17 更 新 位 于 块 设备 中 的 inode， 更 新 的 范围 为 i_mode 至 


i addr. 
18-20 ”如 有 果 设 置 了 参照 标志 位 ， 则 更 新 inode 的 参照 时 间 。 
23-26 ”如 果 设 置 了 更 新 标志 位 ， 则 更 新 inode 的 更 新 时 间 。 
执行 bwrite()， 将 包括 已 更 新 的 inode 在 内 的 块 写 入 块 设 


9.5 inode 与 存储 区 域 的 对 应 关系 


某 个 文件 使 用 的 存储 区 域 的 块 由 inode.i addr[] 管理 。inode 与 存储 
区 域 存 在 下 述 3 种 对 应 关系 。 


。 直接 参照 
。 间接 参照 
。 双重 间接 参照 


PR 3 种 参照 方法 能 够 管理 的 文件 长 度 依次 增 大 。 直 接 参 照 在 inode 的 
ILARG 标志 位 为 0 时 使 用 ， 存 储 区 域 的 块 编写 直接 保存 于 

inode.i addr[] 中 。 将 文件 中 希望 访问 的 字 节 偏 移 量 N 除 以 512 (= 

块 长 度 ) 时 的 商用 b 来 表示 。 (ILARG 标志 位 为 0 时 ) b 一 定 小 于 或 等 
T 7. i addr[b] 中 保存 着 相应 的 块 编写。 直接 参照 能 够 管理 的 最 大 文 
件 长 度 为 512 字 节 x8 = 4KB (图 9-8)。 


间接 参照 适用 于 inode 的 ILARG 标志 位 为 1 的 情况 ， 且 前 述 的 b 除 以 
256 (1 个 字 x256 = 512 字 节 ) 的 商 小 于 等 于 6。 如 果 将 b 除 以 256 的 两 
Wi, inode.i addr[i] 则 保存 着 作为 间接 参照 块 的 存储 区 域 中 的 块 
编号 。 前 述 N 的 除法 运算 得 到 的 余数 可 以 决定 间接 参照 块 中 的 偏 移 

量 ， 其 中 容纳 着 保存 目标 数据 的 存储 区 域 的 块 编号 。 间 接 参照 所 能 管理 
的 最 大 文件 长 度 为 512 字 节 x256x7 = 896KB。 


双重 间接 参照 适用 于 inode 的 ILARG 标志 位 为 1， 且 前 述 的 i 的 值 为 7 
的 情况 。inode.i_addr[7] 容纳 着 间接 参照 块 的 起 始 地 址 ， 而 间接 参 
照 块 的 各 个 数据 又 分 别 指向 双重 间接 参照 块 的 地 址 。 双 重 间 接 参 照 在 理 
论 上 可 以 管理 的 文件 长 度 为 512 字 节 x256x256 = 32MB (再 加 上 通过 
inode.i addr[6-0] 的 间接 参照 管理 的 896KB) ， 但 是 由 于 文件 长 度 
是 以 24 比特 的 形式 保存 的 ， 因 此 实际 上 只 能 管理 16MB 的 文件 (图 9-9 
J% 























inode.i addr[] 存储 





inode.i addrí] 存储 区 域 





inode.i_addr[0~6] 
为 间接 参照 
inode.i addr[7] 
为 双重 间接 参照 





图 9-9 间接 参照 

在 之 后 的 说 明 中 ， 会 将 通过 文件 的 字 节 偏 移 量 除 以 512 的 商 得 到 的 块 编 
FARR T 将 实际 保存 数据 的 存储 区 域 的 块 编号 称 为 物理 块 编 
TT o 

bmap() 


bmap () 是 将 逻辑 块 编号 变换 为 物理 块 编号 的 函数 〈 表 9-13， 代 码 清 单 
9-15) 。 


表 9-13 ”bmap0 的 参数 


辑 块 编号 








E pe 


代码 清单 9-15 bmap( Cken/subr.c) 





1 bmap(ip, bn) 
2 struct inode *ip; 


3 int bn; 

4 1 

5 register *bp, *bap, nb; 

6 int *nbp, d, i; 

7 

8 d = ip-»i dev; 

9 if(bn & -077777) ( 

10 u.u error - EFBIG; 

11 return(0); 

12 ) 

13 

14 /* 直接 参照 */ 

15 if((ip-»i mode&ILARG) -- 0) ( 
16 if((bn & ~7) != e) { 

17 if ((bp = alloc(d)) == NULL) 


18 return(NULL); 


19 bap = bp-»b addr; 





20 for(i-0; i«8; i++) ( 

21 *bapr- = ip-»i addr[i]; 
22 ip-»i addr[i] = 6€; 

23 ) 

24 ip-»i addr[0] = bp-»b blkno; 
25 bdwrite(bp); 

26 ip-»i mode -| ILARG; 

27 goto large; 

28 } 

29 nb = ip->i addr[bn]; 

30 if(nb -- 0 && (bp = alloc(d)) !- NULL) ( 
31 bdwrite(bp); 

32 nb - bp-»b blkno; 

33 ip-»i addr[bn] = nb; 

34 ip-»i flag -| IUPD; 

35 } 

36 rablock = 6; 

37 if (bn«7) 

38 rablock = ip-»i addr[bn-41]; 
39 return(nb); 

40 } 

41 

42 [* 间接 参照 */ 

43 large: 

44 i = bn>>8; 

45 if(bn & 0174000) 

46 i = 7; 

47 if((nb=ip->i addr[i]) == €) { 

48 ip-»i flag =| IUPD; 

49 if ((bp = alloc(d)) == NULL) 

50 return(NULL); 

51 ip-»i addr[i] = bp-»b blkno; 

52 ) else 

53 bp = bread(d, nb); 

54 bap = bp-»b addr; 

55 

56 /* 双重 间接 参照 */ 

57 if(i == 7) { 

58 i = ((bn>>8) & 0377) - 7; 

59 if((nb=bap[i]) == ð) { 

60 if((nbp = alloc(d)) == NULL) { 
61 brelse(bp); 

62 return(NULL); 

63 } 

64 bap[i] = nbp-»b blkno; 


65 bdwrite(bp); 


66 ) else { 


67 brelse(bp); 

68 nbp = bread(d, nb); 
69 ) 

70 bp - nbp; 

71 bap = bp-»b addr; 

73 ) 

73 

74 i = bn & 0377; 

75 if((nb-bap[i]) == © && (nbp = alloc(d)) != NULL) { 
76 nb = nbp-»b blkno; 

77 bap[i] = nb; 

78 bdwrite(nbp); 

79 bdwrite(bp); 

80 ) else 

81 brelse(bp); 

82 rablock - 6; 

83 if(i « 255) 

84 rablock = bap[i+1]; 

85 return(nb); 

86 ) 





9-12 ”如 果 参 数 的 逻辑 块 编写 的 值 过 大 ， 则 认为 出 错 。 


15 ”如 果 没 有 设置 inode[ ] 元 素 的 ILARG 标志 位 ， 则 按照 直接 参 
照 的 方式 进行 处 理 。 


16 ”直接 参照 时 ， 参 数 bn 的 值 应 该 小 于 或 等 于 

7 (inode.i addr[] 的 元 素数 ) 。 如 果 大 于 7， 则 切换 至 间接 参 
照 方式 。 这 种 情况 只 有 在 满足 下 述 条 件 时 才 会 发 生 ， 即 对 文件 的 写 
入 操作 由 writei() 进行 ， 且 文件 长 度 大 于 4KB。 


执行 alloc()， 从 存储 区 域 分 配 新 的 块 ， 并 取得 相应 的 组 
冲 区 。 


19-23 将 inode.i addr[] 内 的 数据 复制 到 刚 取得 的 缓冲 区 ， 然 
后 将 inode.i addr[] 内 的 数据 清 0。 


24 将 inode.i addr[0] 设置 为 刚 取得 的 块 的 块 编号 。 


25 执行 bdwrite() 对 块 进行 写 入 操作 。inode.i_addr[] FE 
本 容纳 的 数据 被 输出 。 


26-27 设置 inode[ ] 元 素 的 ILARG 标志 位 ， 然 后 跳 转 至 large, 
进行 间接 参照 处 理 。 


29 从 此 处 开始 为 一 般 的 直接 参照 处 理 。 首 先 取 得 由 参数 指定 的 逻 
辑 块 编号 指向 的 inode.i addr[] 的 值 。 


30-35 ”由 于 文件 长 度 变 大 ， 此 处 需要 取得 新 的 块 。 如 果 从 
inode.i addr[] 取得 的 值 为 0， 且 通过 alloc() 成 功 取得 新 的 块 
(的 缓冲 区 ) ， 则 将 新 取得 的 块 的 块 编号 注册 到 
inode.i_addr[]， 并 设置 inode[] 元 素 的 更 新 标志 位 。 


36~38 ”注册 预 读 取 块 编 号 。 如 果 逻 辑 块 编写 小 于 7， 则 注册 与 下 
一 个 逻辑 块 编号 相对 应 的 物理 块 编 号 。 如 果 是 从 头 开 始 按 顺 序 处 理 
文件 内 容 等 情况 ， 则 很 有 可 能 会 立即 对 下 一 个 逻辑 块 进行 处 理 ， 
此 ， 此 处 将 其 注册 为 预 处 理 块 。 


39 返回 物理 块 编号 。 
42 ”此 处 开始 为 间接 参照 处 理 。 


44-46 ”将 逻辑 块 编号 向 右 移动 8 比特 后 的 值 赋 予 i。 间 接 参照 

HI, inode.i addr[] 的 每 个 元 素 对 应 256 BER, WAR 8 比特 

后 的 值 (= 除 以 256 的 商 ) 相当 于 inode.i addr[] 的 数组 下 标 。 

如 果 逻 辑 块 编号 的 值 大 于 等 于 0174000 (=2048=256x8) 则 采用 双 

212 此 时 需要 使 用 inode.i addr[7]， 因 此 将 i 的 值 设 
H7. 


47-54 ”如 果 inode.i addr[i] 的 值 为 0， 则 设置 inode[] 元 素 
的 更 新 标志 位 。 通 过 alloc() 从 存储 区 域 取得 新 的 块 〈 的 缓冲 
区 ) ， 并 将 取得 的 块 的 块 编号 赋予 inode.i_addr[i]。 如 果 
inode.i addr[i] 的 值 不 为 0， 则 通过 bread() 读 取 该 块 的 内 


Dd 


5. 
57 ”此 处 开始 到 第 72 行为 双重 间接 参照 处 理 。 
58 计算 第 一 级 参照 块 中 相应 的 块 编 号 。 从 问 右 移动 8 比特 后 的 值 


中 减 去 7， 表 示 从 逻辑 块 编号 中 减 去 1792 (=7x256) 。 通 过 这 个 计 
算 可 以 取得 在 双重 间接 参照 (inode.i_addr[7]) 第 一 级 参照 块 





























中 的 偏 移 量 。 


59~65 如果 第 一 级 参照 块 中 相应 元 素 的 块 编号 为 0 时 ， 通 过 
alloc() 从 存储 区 域 取 得 新 的 块 《〈 的 缓冲 区 ) ， 并 将 取得 的 块 的 块 
编号 分 配给 相应 元 素 ， 然 后 执行 bdwrite()， 对 块 设备 进行 延迟 写 
Na 


o 相应 元 素 持 有 0 以 外 的 块 编号 时 ， 执 行 bread() 读 取 该 块 


70-71 用 取得 的 块 设备 缓冲 区 更 新 变量 bp 和 bap。 对 第 二 级 参照 
块 的 损 历 处 理由 此 后 一 般 的 间接 参照 处 理 进行 。 


7A 此 处 开始 为 一 般 间接 参照 块 的 读 取 处 理 。i 被 设 定 为 逻辑 块 编 
号 的 低位 比特 ， 相 当 于 间接 参照 块 中 的 仿 移 量 。 


75~81 ”由 间接 参照 块 中 的 偏 移 量 取 得 块 编写。 如果 为 0， 则 尝试 
通过 alloc() 从 存储 区 域 取 得 新 的 块 。 将 取得 的 块 的 块 编写 分 配 
给 偶 移 量 ， 然 后 执行 bdwrite() 对 取得 的 块 和 间接 参照 块 进行 延 
AREA. WRR 70 则 释放 间接 参照 块 。 


82-84 将 了 预 读 取 块 编号 设 定 为 与 下 一 个 迎 辑 块 编号 相对 应 的 物理 


块 编 号 。 
85 返回 物理 块 编号 。 








itrunc() 


itrunc() 将 参数 inode[] 元 素 使 用 的 存储 区 域 的 块 编号 返还 给 空闲 队 
Jj (X 9-14， 代 码 清单 9-16 ) ， 然 后 将 文件 长 度 和 inode.i addr[] 
全 部 清 0。 


间接 参照 时 ， 将 相应 的 间接 块 也 一 并 返还 到 空 几 队列。 文件 数据 本 映 仍 
保存 在 块 设 备 的 存储 区 域 中 ， 直 到 该 区 域 个 别 的 数据 覆盖 。 


K 9-14 itrunc(Q 的 参数 





参数 


n» 
x 


inode[] JUR 





代码 清单 9-16 itrunc() (ken/iget.c) 


register *rp, *bp, *cp; 
int *dp, *ep; 


rp - ip; 
if((rp-»i mode&(IFCHR&IFBLK)) !- 0) 
return; 
for(ip = &rp-»i addr[7]; ip >= &rp-»i addr[0]; ip--) 
if(*ip) ( 
if((rp-»i mode&ILARG) !- 0) ( 
bp = bread(rp-»i dev, *ip); 
for(cp = bp-»b addr+512; cp >= bp-»b addr; cp--) 
if(*cp) ( 
if(ip -- &rp-»i addr[7]) ( 
dp = bread(rp-»i dev, *cp); 


for(ep = dp-»b addr+512; ep >= dp-»b addr; ep--) 
if(*ep) 

free(rp-»i dev, *ep); 
brelse(dp); 


} 
free(rp->i dev, *cp); 
} 
brelse(bp); 
j 
free(rp-»i dev, *ip); 
*ip = 6; 
} 
rp-»i mode =& ~ILARG ; 
rp->i sizeO = 6; 
rp->i_size1 = 0; 
rp-»i flag -| IUPD; 





8-9 如 有 果 是 特殊 文件 ， 则 不 做 任何 处 理 立 即 返 回 。 


10-11 遍历 inode.i addr[]. 
12 如果 设置 了 ILARG 标志 位 ， 则 遍历 间接 参照 块 。 
13 读 取 与 inode.i addr[] 元 素 指向 的 块 编号 相对 应 的 块 。 


14~26 参照 块 容纳 着 块 编写 的 队列 。 从 后 回 前 志 历 队列 ， 通 过 执 
ÍT free()， 每 次 都 返还 一 个 块 编写 给 空间 队列 。 因 为 

inode.i addr[7] 供 双重 间接 参照 使 用 ， 首 先 读 取 各 块 编 号 所 指 
加 的 块 ， 再 通过 free() 将 其 中 保存 的 块 编号 队列 返还 给 空闲 队 
列 。 


27-28 执行 free()， 将 inode.i addr[] 元 素 指 向 的 块 编号 返 
还 给 空闲 队列 ， 并 将 inode.i addr[] 元 素 的 值 置 为 0。 


30-33 Æ inode[] 元 素 的 ILARG 标志 位 ， 将 文件 长 度 设 为 0， 
并 设置 更 新 标志 位 。 


9.6 ”分配 块 设备 中 的 块 


块 设备 中 的 inode 和 存储 区 域 中 的 块 ， 分 别 由 超级 块 中 的 inode A18 BA. 
列 (filsys. s_inode[]， 和 存储 空间 队列 Cfilsys.s free[]) 管 
理 。filsys.s_inode[] 和 filsys.s_free[] 的 元 素数 为 100, 分 别 
保存 着 未 分 配 的 inode 编号 和 未 分 配 的 存储 区 域 的 块 编号 。 而 
filsys.s ninode 和 filsys.s_nfree 分 别 容纳 inode 空闲 队列 和 存 
储 空 闲 队列 中 编号 的 数量 。 这 两 个 变量 的 值 变 为 0 时 ， 需 要 从 块 设备 取 
得 未 分 配 的 inode 编号 和 块 编号 补充 空闲 队列 。 


ialloc() 


ialloc() 用 来 分 配 块 设备 中 inode 区 域 的 未 分 配 inode (X 9-15, RIY 
清单 9-17 ) 。 首 先 取得 由 filsys.s ninode 指向 的 
filsys.s inode[] 元素， 然后 通过 inode 编号 取得 inode[] 元 素 ， 同 
时 递减 filsys.s_ninode。 将 位 lsys.s_inode[] 看 做 存放 未 使 用 
o 编号 的 栈 ， 将 filsys.s ninode 看 做 栈 指 针 ， 可 能 更 容易 理解 

CÉ 9-102 。 


filsys.s inode[] 为 空 时 ， 从 块 设备 的 inode 区 域 的 头 部 〈 块 编号 2 
) 开始 按 顺 序 检查 inode， 将 未 使 用 的 inode 编号 追加 至 
filsys.s inode[] (图 9-11 . 


由 于 当 filsys.s inode[] 为 空 时 才 需 要 访问 块 设备 ， 这 与 每 当 收 到 
Ws inode 的 请 求 时 则 立即 访问 块 设备 的 做 法 相 比 ， 在 性 能 上 具 


执行 iget() 并 返回 
inode[] 元 素 


i 


«— —— filsys.s ninode 





0 


filsys.s. inodel[] 的 
数组 下 标 


filsys.s inode[] 


图 9-10 ialloc() 


内 存 


块 设备 


inode 区 域 


filsys.s inodel[] 


1 





图 9-11 对 inode 空闲 队列 进行 补 } 


表 9-15 ialloc() 的 参数 


dev 设备 编号 


代码 清单 9-17 ialloc() (ken/alloc.c) 





1 ialloc(dev) 
2 { 
3 register *fp, *bp, *ip; 
4 int i, j, k, ino; 
5 
6 fp = getfs(dev); 
7 while(fp->s_ilock) 
8 sleep(&fp->s_ilock, PINOD); 
9 loop: 
10 if(fp-»s ninode > 0) ( 
11 ino = fp-»s inode[--fp-»s ninode]; 
12 ip = iget(dev, ino); 
13 if (ip--NULL) 
14 return(NULL); 
15 if(ip-»i mode == 0) ( 
16 for(bp = &ip-»i mode; bp « &ip-»i addr[8];) 
17 *bp++ = 0; 
18 fp-»s fmod = 1; 
19 return(ip); 
20 } 
21 iput(ip); 
22 goto loop; 
23 } 
24 fp->s_ilock++; 
25 ino = 0; 
26 for(i=0; i<fp->s_isize; i++) { 
27 bp = bread(dev, i+2); 
28 ip = bp->b_addr; 
29 for(j=0; j<256; j=+16) { 
30 inor*; 
31 if(ip[j] !» €) 
32 continue; 
33 for(k20; k«NINODE; k++) 
34 if(dev--inode[k].i dev && ino--inode[k].i number) 
35 goto cont; 
36 fp-»s inode[fp-»s ninode-4] = ino; 
37 if(fp-»s ninode »- 100) 
38 break; 
39 cont:; 
40 i 


41 brelse(bp); 


42 if(fp-»s ninode »- 100) 


43 break; 

44 ) 

45 fp-»s ilock = 0; 

46 wakeup(&fp-»s ilock); 

47 if (fp-»s ninode » 0) 

48 goto loop; 

49 prdev("Out of inodes", dev); 
50 u.u error - ENOSPC; 

51 return(NULL); 

52 ) 





6 取得 与 参数 的 设备 编号 相对 应 的 filsys 结构 体 〈 超 级 块 ) 。 
7-8 ”进入 睡眠 状态 直至 解锁 filsys 结构 体 。 

10 当 inode 空闲 队列 中 还 存在 未 分 配 的 inode 编号 时 的 处 理 。 

11 取得 位 于 inode FWMA GR) 头 部 的 inode 编号 。 

12~14 利用 所 取得 的 inode 编号 调用 iget() 以 取得 inode[] 元 


Ao 


15 取得 的 inode[] TRK i mode 为 0 时 的 处 理 ( 释 放 inode 时 
相应 的 inode[] 76A] i mode 被 清 0， 如 果 i mode 不 为 0 则 说 
明 该 inode[] 元 素 仍 处 于 使 用 中 的 状态 ， 或 者 inode 的 释放 处 理 未 
能 正常 执行 ) 。 

16~17 将 inode[] 元 素 从 i_mode € i addr 的 部 分 清 0。 


18 将 filsys.s_ fmod 置 1 以 设置 filsys 结构 体 的 更 新 标志 
位 。 





19 返回 inode[ ] 元 素 。 


21-22 ”如果 inode.i_mode 的 值 不 为 0， 则 释放 取得 的 inode[] 
元 素 ， 然 后 返回 loop 处 ， 并 再 次 尝试 取得 inode. 


24 如 果 空 闲 队列 内 不 存在 尚未 分 配 的 inode 编写 ， 则 取得 
filsys 结构 体 的 锁 。 


26 ”遍历 块 设备 的 inode 的 块 (#2~) 。 
29 ”遍历 块 中 所 有 的 inode。 


31-32 如果 inode.i_mode 不 为 0， 则 表示 该 inode 处 于 使 用 中 的 
状态 ， 执 行 continue. 


33~35 WR inode[] 中 存在 相应 元 素 则 跳 转 至 cont。 似 乎 是 在 
块 设 备 和 内 存 中 都 确认 了 该 inode 未 被 分 配 ， 所 以 才 将 其 视 作 未 分 
配 inode。 





36 将 inode 编号 追加 至 空闲 队列 。 
37-38 如果 空闲 队列 已 满 ， 则 执行 break 退出 循环 。 


42~43 ”如 果 空 闲 队列 已 满 ， 则 执行 break 退出 循环 ， 终 止 补 充 空 
闲 队列 的 处 理 。 


45 释放 filsys 结构 体 的 锁 。 
46 唤醒 正在 等 待 解锁 filsys 结构 体 的 进程 。 


47~48 ”如 果 问 空 几 队列 至 少 补充 一 个 未 分 配 的 inode 编号 ， 则 返 
回 Loop 执行 分 配 inode 的 处 理 。 


ifree() 


ifree() 用 于 释放 inode (X 9-16, (C318 & 9-18 ) 。 将 被 释放 的 
inode 的 inode 编号 追加 至 空闲 队列 。 如 果 空 闲 队列 已 满 ， 则 丢弃 inode 
编写 (图 9-12 ) . EF KY inode 编号 在 通过 ialloc() 补充 空闲 队列 时 
被 回收 。 


如 果 空 闲 队列 
存在 空间 «— filsys.s ninode 
inode 编号 

-一 一 一 -一 一 全 


filsys.s inodel] 
«— filsys.s ninode(100) 


空闲 队列 已 满 时 
inode 编号 


即使 此 时 未 被 追加 至 空闲 
队列 ， 在 执行 ialloc() 补充 
空闲 队列 时 也 会 被 回收 


filsys.s. inodel] 
图 9-12 ifree() 
K 9-16 ifree() 的 参数 





代码 清单 9-18 ifree() (ken/alloc.c) 


1 ifree(dev, ino) 
2í1 
3 register *fp; 


4 
5 fp = getfs(dev); 
6 if(fp-»s ilock) 
7 
8 


return; 
if(fp-»s ninode »- 100) 
9 return; 
10 fp-»s inode[fp-»s ninode-«4] = ino; 
11 fp-»s fmod = 1; 
12 ) 





5 取得 与 参数 指定 的 设备 编号 相对 应 的 filsys 结构 体 。 
6~7 WR filsys 结构 体 被 加 锁 ， 则 不 做 任何 处 理 立 即 返 回 。 尽 








管 此 时 未 能 将 当前 的 inode 编写 回收 至 空 几 队列 ， 但 在 通过 
ialloc() 补充 空 帮 队列 时 ， 一 定 会 进行 回收 。 


8~9 ”当空 几 队 列 已 满 时 ， 不 做 任何 处 理 立 即 返回 。 出 于 与 上 述 同 
样 的 原因 ， 此 处 也 不 存在 回收 的 问题 。 


10 将 inode 编号 返回 至 空 亲 队列 。 
11 设置 filsys 结构 体 的 更 新 标志 位 。 





alloc() 


alloc() 是 分 配 块 设备 存储 区 域 中 未 使 用 的 块 的 函数 〈 表 9-17, fis 
单 9-19 ) 。 首 先 取 得 filesys.s nfree 指向 的 filsys.s free[] 元 
素 ， 然 后 使 用 该 块 编写 取得 块 设备 的 缓冲 区 。 


如 果 空 闲 队 列 已 室 ， 则 从 块 设备 存储 区 域 取 得 未 使 用 的 块 编号 ， 将 其 补 
充 至 空 亲 队列 。 此 处 的 补充 处 理 与 针对 inode 的 补充 处 理 有 很 大 不 同 。 
块 设备 中 的 每 99 个 未 使 用 的 块 编号 用 工 个 队列 管理 ， 队 列 头 部 的 元 素 
保存 着 队列 中 的 元 系数 和 下 一 个 队列 的 块 编 号 〈 图 9-13 ) 。 这 个 未 使 
用 块 编号 的 队列 在 执行 /etc/mkfs 时 生成 ， 通 过 复制 该 队列 补充 存储 
空闲 队列 CE 9-14) 。 








存储 区 域 





图 9-13 未 使 用 块 编写 的 队列 


块 设备 存储 区 域 





图 9-14 4T ETN BA 
K 9-17 alloc() 的 参数 


ii 
eX 
|. 5 —  —3j 


代码 清单 9-19  alloc() (ken/alloc.c) 








lloc(dev) 


int bno; 
register *bp, *ip, *fp; 


while(fp-»s flock) 

sleep(&fp-»s flock, PINOD); 
do ( 

if(fp-»s nfree «- 0) 


1 
2 
3 
4 
5 
6 fp = getfs(dev); 
7 
8 
9 
0 
1 goto nospace; 


12 bno = fp-»s free[--fp-»s nfree]; 


13 if(bno -- 0) 

14 goto nospace; 

15 ) while (badblock(fp, bno, dev)); 
16 if(fp-»s nfree <= 0) ( 

17 fp-»s flocke*; 

18 bp = bread(dev, bno); 
19 ip = bp-»b addr; 

20 fp-»s nfree = *ip++; 
21 bcopy(ip, fp-»s free, 100); 
22 brelse(bp); 

23 fp-»s flock = 0; 

24 wakeup(&fp-»s flock); 
25 

26 bp = getblk(dev, bno); 

27 clrbuf(bp); 

28 fp-»s fmod = 1; 

29 return(bp); 

30 

31 nospace: 

32 fp-»s nfree = 0; 

33 prdev("no space", dev); 
34 u.u error - ENOSPC; 

35 return(NULL); 

36 ) 





6 取得 与 参数 指定 的 设备 编写 相对 应 的 filsys 结构 体 。 


7-8 ”如果 位 lsys 结构 体 被 加 锁 ， 则 进入 睡眠 状态 直至 解锁 。 

9 进行 循环 直至 取得 合适 的 块 编 号 。 如 果 取 得 的 块 编号 既 未 指 回 
只 设备 的 inode 区 域 ， 也 未 指 回 存储 区 域 ，badb1lock() 将 返回 
1。 

10-11 如 果 空 亲 队 列 为 空 则 跳 转 至 nospace。 

12~14 ”从 空闲 队列 取得 块 编号 。 如 果 为 0 则 跳 转 至 nospace。 


16 ”如 果 取 得 了 合适 的 块 编号 ， 且 空闲 队列 变 为 空 时 ， 对 其 进行 补 
充 处 理 。 


17 对 filsys 结构 体 加 锁 。 


18 取得 的 块 编号 指向 容纳 着 下 一 个 未 使 用 块 编号 队列 的 块 ， 执 行 
bread() 读 取 该 块 。 


20 在 读 取 的 块 的 头 部 容纳 着 该 队列 中 块 编 号 的 数量 ， 将 其 复制 到 


filsys.s nfree. 

21 执行 bcopy()， 将 队列 整体 找 贝 到 filsys.s free. 

22 释放 绥 冲 区 。 

23 将 filsys 结构 体 解锁 。 

24 ”唤醒 正在 等 待 解锁 filsys 结构 体 的 进程 。 

26 利用 取得 的 块 编写 ， 执 行 getblk()， 取 得 对 应 的 缓冲 区 。 
27 ”将 取得 的 缓冲 区 清 0。 

28 设置 filsys 结构 体 的 更 新 标志 位 。 


























4 这 里 的 原文 有 误 。 只 有 当 块 编号 未 指向 存储 区 域 时 ，badblock() 才 返回 1。 一 一 译 者 注 




















free() 


free() 用 于 释放 存储 区 域 的 块 ( 表 9-18， 代 码 清单 9-20 ) ， 并 将 块 编 
写 妃 加 人 至 容 闪 队列。 当空 队列 已 满 时 ， 将 空 队 列 的 内 容 写 入 准备 释 
放 的 块 。 写 入 的 内 容 为 ， 以 当前 的 filsys.s_nfree 为 起 始 元 素 ， 其 后 
跟随 filsys.s free[] 元 素 。 随 后 将 filsys.s_nfree 清 0， 并 将 
filsys.s free[0] 设 定 为 准备 释放 的 块 的 块 编写 (图 9-15) 。 





内 存 ! 块 设备 存储 区 域 
filsys.s. free[] | 
< 一 准备 释放 的 块 
99 块 编号 
存储 区 域 
filsys.s freel] 
2 NENNEN TUM 
BG < 一 准备 释放 的 块 
2 块 编 号 
99 
图 9-15 free() 
K 9-18 free() 的 参数 
参数 aX 








代码 清单 9-20 free() (ken/alloc.c) 


free(dev, bno) 
{ 
register *fp, *bp, *ip; 


fp = getfs(dev); 
fp->s_fmod = 1; 
while(fp->s_flock) 
sleep(&fp-»s flock, PINOD); 
if (badblock(fp, bno, dev)) 
return; 
if(fp-»s nfree «- 0) 
fp-»s nfree - 1; 
fp-»s free[0] = ð; 
j 
if(fp-»s nfree »- 100) ( 
fp-»s flocke-; 
bp = getblk(dev, bno); 
ip = bp-»b addr; 
*ip++ = fp-»s nfree; 
bcopy(fp-»s free, ip, 100); 
fp-»s nfree - 0; 
bwrite(bp); 
fp-»s flock = 6; 
wakeup(&fp-»s flock); 
} 
fp->s_free[fp->s_nfree++] = bno; 
fp->s_fmod = 1; 


5 取得 与 参数 指定 的 设备 编号 相对 应 的 filsys 结构 体 。 
6 设置 filsys 结构 体 的 更 新 标志 位 。 
7~8 进入 睡眠 状态 直至 解锁 filsys 结构 体 。 


9-10 如果 参数 的 块 编号 的 值 有 误 则 返回 。 


11~14 ”如 果 filsys.s_nfree 的 值 小 于 等 于 0， 则 将 其 设 为 1， 
并 将 filsys.s free[0] 设 为 0。 


15 


列 。 


16 


17 


19 


20 


21 


22 


23 


24 


26 


如 果 空 几 队 列 已 满 ， 则 将 空间 队列 写 入 块 设备 ， 并 重 置 空 几 队 


将 filsys 结构 体 加 锁 。 

取得 与 参数 的 块 编号 相对 应 的 缓冲 区 。 

将 filsys.s_nfree 保存 至 缓冲 区 的 起 始 位 置 。 

将 空闲 队列 整体 复制 到 缓冲 区 。 

将 filsys.s_nfree 设 定 为 0 (将 空间 队 列 清空 )。 

将 保存 空闲 队列 的 缓冲 区 写 入 块 设备 。 

将 filsys 结构 体 解锁 。 

唤醒 正在 等 待 解锁 filsys 结构 体 被 进程 。 

向 空闲 队列 追加 块 编号 。 如 果 第 15 行 的 值 为 真 ， 空 闲 队列 的 


头 部 将 被 设 定 为 下 一 个 队列 的 块 编写 。 


27 


设置 filsys 结构 体 的 更 新 标志 位 。 


getfs() 

getfs() 用 来 取得 与 设备 编号 相对 应 的 filsys 结构 体 〈 超 级 块 ) R 
9-19， 代 码 清单 9-21 ) 。 该 函数 在 mount[] 中 寻找 与 参数 指定 的 设备 
编号 相对 应 的 元 素 。 


K 9-19 ”getfs() 的 参数 


参数 


nb» 
x 


代码 清单 9-21 getfs() (ken/alloc.c) 


etfs(dev) 


register struct mount *p; 
register char *n1,. *n2; 


for(p = &mount[0]; p < &mount[NMOUNT]; p++) 
if(p-»m bufp !- NULL && p-»m dev -- dev) { 
p = p-»m bufp-»b addr; 
p-»s nfree; 
n2 - p-»s ninode; 


if(n1 > 100 || n2 > 100) ( 
prdev("bad count", dev); 
p-»s nfree = 6€; 
p-»s ninode - 6; 


return(p); 


panic("no fs"); 





9-15 ”如果 filsys.s nfree x filsys.n ninode 的 值 大 于 
100， 可 认为 是 错误 值 ， 此 时 返回 0。 


badblock() 
badblock() 用 于 检查 块 编号 是 否 合适 ( 表 9-20， 代 码 清单 9-22 . ün 


末 块 编号 指 回 块 设备 中 的 inode 区 域 或 存储 区 域 ， 则 返回 0， 人 否则 返回 
1e 



































5 这 里 的 原文 有 误 o H 有 
译 者 注 


M 





块 编 号 指向 存储 区 域 时 badblock() 才 返 回 0， 否 则 将 返回 1. 








m 














表 9-20 badblock() 的 参数 


| 








代码 清单 9.22 badblock() (ken/alloc.c) 


adblock(afp, abn, dev) 


ca 0o 


register struct filsys *fp; 
register char *bn; 


fp = afp; 
bn = abn; 


if (bn < fp->s_isize+2 || bn >= fp->s_fsize) { 
prdev("bad block", dev); 
return(1); 


\D 0 -0UuU1Aà» U:NFKHB 


} 
return(0); 





9.7 ”将 路 径 变 为 inode 

目录 的 内 容 

文件 和 目录 可 通过 路 径 访问 。 目 录 拥 有 文件 名 和 inode 编号 的 对 应 表 。 
该 表 中 一 条 记录 的 长 度 为 16 字 节 ， 头 部 的 2 字 节 是 与 文件 相对 应 的 
inode 编号 ， 其 后 的 14 字 节 为 文件 或 目录 名 〈 表 9-21 ) 。 请 注意 文件 
ak inode 本 身 并 没有 文件 名 。 


表 9-21 目录 内 容 例 


inode 编号 〈2 FH) 文件 或 目录 名 (14 字 节 ) 









































以 根 目录 或 当前 目录 为 起 点 ， 由 路 径 的 起 始 位 置 开 始 逐 个 取得 与 路 径 的 
各 个 要 素 相 对 应 的 inode[] 元 素 。 如 果 元 素 为 目录 ， 则 取得 与 该 目录 
相对 应 的 inode[]， 然 后 再 重复 上 述 处 理 ， 这 样 束 可 以 取得 与 目标 文件 
或 目录 相对 应 的 全 部 inode[] (B| 9-16) 。 





ij dep TT 

Su /dir1/dir2/file 
om ge | 
0x12 





M | JD5 | 
oo| hoge | | 
| Gp me — 
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图 9-16 人 裔 历 文件 路 径 
namei() 


namei() 遍历 文件 路 径 ， 取 得 与 文件 路 径 名 相对 应 的 文件 或 目录 的 
inode[] 元 素 〈 表 9-22， 代 码 清单 9-24 ) 。 


如 果 给 出 的 路 径 名 的 起 始 字符 为 几 ， 可 判断 该 路 径 为 绝对 路 径 ， 并 将 根 
m 的 起 点 。 人 否则 可 判断 为 相对 路 径 ， 并 将 当前 路 径 作 为 过 历 
SEG Ed o 


从 路 径 名 的 起 始 位 置 开 始 逐 个 取得 构成 路 径 的 各 个 元 素 ， 然 后 遍历 各 个 
目录 对 应 表 所 包含 的 记录 ， 再 使 用 iget() 取得 与 各 记录 相对 应 的 
inode[] 元 素 ， 并 重复 上 述 处 理 。 


思 历 目录 的 同时 检查 路 径 是 否 恰当 和 访问 权限 。 如 果 对 茶 个 目录 不 具备 
执行 权限 ， 是 无 法 访问 该 目录 中 的 数据 的 。 


namei() 的 参数 中 的 flag 代表 准备 对 路 径 表 示 的 文件 进行 的 操作 ， 可 
指定 的 操作 包括 寻找 、 生 成 或 是 删除 。 根 据 指定 的 操作 ， 会 相应 的 更 新 
user 结构 体 的 内 容 。 


e u.u pdir: 只 有 当 准 备 生成 新 的 文件 或 目录 时 ， 才 会 设 定 为 与 对 
象 文 件 的 父 目 录 相 对 应 的 inode[] 元 素 。 如 果 准 备 生 成 名 
为 “home/hoge/fuga" 的 文件 ， 则 将 u.u_pdir 设 定 为 

















与 “rhome/hoge” 相 对 应 的 inode[ ] 元 素 


e u.u offset: 只 有 当 准 备 生 成 新 的 文件 或 目录 时 ， 才 会 设 定 为 指 
问 对 象 文 件 父 目录 中 空 记 录 的 侦 移 量 


e u.u dbuf : 文件 名 或 目录 名 。 如 果 路 径 名 为 “home/hoge/fuga”， 
则 将 u.u dbuf 设 定 为 “fuga” 


很 多 函数 都 是 使 用 上 述 更 新 后 的 数据 进行 目 身 处 理 的 ， 因 此 在 执行 这 些 
函数 之 前 ， 需 要 首先 执行 namei(). 


namei() 通过 执行 schar() 和 uchar() 取得 路 径 名 《代码 清单 9-23 
) 。schar() 和 uchar() 的 区 别 在 于 路 径 名 是 保存 在 用 户 空间 还 是 内 
核 空间 。 


一 般 来 说 ， 用 户 程序 通过 系统 调用 对 文件 进行 操作 。 此 时 在 trap() 

中 ， 将 u.u_dirp 设 定 为 u.u_arg[6]。u.u_arg[86] 是 赋予 系统 调用 
的 参数 ， 被 设 定 为 路 径 名 的 地 址 。uchar() 通过 一 边 对 u.u_dirp 进行 
位 移 操作 ， 一 边 执行 fubyte()， 在 用 户 空间 逐个 处 理 构 成 数据 的 字 
符 。 

当 内 核 程序 希望 独自 操作 文件 时 ， 也 采取 将 u.u_dirp 设 定 为 路 径 名 地 
址 的 方式 。 此 时 不 会 发 生 模式 的 切换 ， 而 是 通过 递增 u.u_dirp 对 字符 
进行 逐个 处 理 。 


代码 清单 9-23 schar() 和 uchar() 


























return(*u.u dirp++ & 0377); 


uchar() 


register c; 


c = fubyte(u.u dirp++); 
if(c == -1) 

u.u error - EFAULT; 
return(c); 





K 9-22 namei() 的 参数 








func |&uchar 或 &schar。 区 别 在 于 路 径 名 是 存在 于 月 








0: 寻找 路 径 名 所 示 的 inode。1 : 生成 路 径 名 所 示 的 inode。2 : 删除 路 径 名 所 
示 的 inode 





代码 清单 9-24  namei() 和 ken/namei.c 





1 namei(func, flag) 
2 int (*func)(); 


4 register struct inode *dp; 
5 register c; 

6 register char *cp; 

7 int eo, *bp; 

8 
9 


dp = u.u cdir; 
10 if((ce(*func)()) == '/') 


11 dp = rootdir; 

12 iget(dp->i_dev, dp->i_number); 
13 while(c == '/') 

14 c = (*func)(); 

15 if(c == 'Ne' && flag !- O0) ( 
16 u.u error - ENOENT; 

17 goto out; 

18 } 

19 

20 cloop: 

21 if(u.u error) 

22 goto out; 

23 if(c == '\@') 

24 return(dp); 

25 

26 if((dp-»i mode&IFMT) !- IFDIR) { 
27 u.u error - ENOTDIR; 

28 goto out; 


30 if(access(dp, IEXEC)) 


31 goto out; 

32 

33 cp = &u.u dbuf[0]; 

34 while(c!2'/' && c!='\0' && u.u error--0) ( 
35 if(cp « &u.u dbuf[DIRSIZ]) 
36 *Cprt = C; 

37 c = (*func)(); 

38 

39 while(cp < &u.u_dbuf[DIRSIZ]) 
40 *cp++ = 'N0O'; 

41 while(c == '/') 

42 c = (*func)(); 

43 if(u.u_error) 

44 goto out; 

45 

46 u.u_offset[1] = 6€; 

47 u.u offset[0] = ð; 

48 u.u_segflg = 1; 

49 eo = ð; 

50 u.u count = ldiv(dp->i_size1, DIRSIZ+2); 
51 bp = NULL; 

52 

53 eloop: 

54 

55 if(u.u count == 0) { 

56 if(bp != NULL) 

57 brelse(bp); 

58 if(flag--1 && c=='\0') ( 

59 if(access(dp, IWRITE)) 
60 goto out; 

61 u.u pdir = dp; 

62 if(eo) 

63 u.u offset[1] = eo-DIRSIZ-2; else 
64 dp-»i flag -| IUPD; 
65 return(NULL); 

66 } 

67 u.u error = ENOENT; 

68 goto out; 

69 } 

70 

71 if((u.u offset[1]80777) == 0) ( 
72 if(bp != NULL) 

73 brelse(bp); 

74 bp = bread(dp-»i dev, 

75 bmap(dp, l1div(u.u offset[1], 512))); 


76 ) 


78 bcopy(bp-»b addr«(u.u offset[1]&0777), &u.u dent, (DIRSIZ42)/2); 
79 u.u offset[1] =+ DIRSIZ+2; 

80 u.u count--; 

81 if(u.u dent.u ino == 0) ( 

82 if(eo == 0) 

83 eo - u.u offset[1]; 

84 goto eloop; 

85 } 

86 for(cp = &u.u dbuf[0]; cp < &u.u dbuf[DIRSIZ]; cp++) 
87 if(*cp != cp[u.u dent.u name - u.u dbuf]) 
88 goto eloop; 

89 

90 if(bp != NULL) 

91 brelse(bp); 

92 if(flag--2 && c=='\0') ( 

93 if(access(dp, IWRITE)) 

94 goto out; 

95 return(dp); 

96 } 

97 bp = dp->i dev; 

98 iput(dp); 

99 dp = iget(bp, u.u dent.u ino); 

100 if(dp == NULL) 

101 return(NULL); 

102 goto cloop; 

103 

104 out 

105 iput(dp); 

106 return(NULL); 











9911 rootdir 表示 与 根 目 录 相 对 应 的 inode[] 元 素 ， 在 系统 启 
动 时 设 定 《代码 清单 9-25) 。 如 果 路 径 名 以 ‘开始 ， 则 将 dp wE 








为 与 根 目录 相对 应 的 inode[] 元 素 ， 否 则 将 其 设 定 为 
u.u cdir (当前 目录 ) 。dp 将 作为 遍历 的 起 点 。 


代码 清单 9-25 rootdir (system.h) 


1 int *npootdir; 


12 执行 ijget() 并 等 待 解 锁 inode[] 元 素 ， 然 后 确认 相关 的 文件 


,LDACRSRS, WMS Ri Aa. HX inode[] 元 素 加 锁 。 


13~14 ”如 果 路 径 名 中 的 指针 指 问 ‘ 则 忽略 该 字符 ， 移 动 指针 使 其 
指 同 ‘的 下 一 个 字符 ， 并 将 该 字符 赋予 c。 结 束 循环 时 ， 如 果 路 径 
名 为 “/W//home/fuga” 则 c 的 值 为 和 h?。 如 果 路 径 名 为 “foo/var* 则 c 的 
(B7y'P. 


15-18 KZK CFFE) 、 和 或 WP? 时， 此 处 if 语句 中 的 c 
== “\6: 的 值 为 真 。 根 目录 是 无 法 生成 或 删除 的 。 


20 以 cloop 为 起 点 的 代码 从 u.u_dirp 指向 的 元 素 中 取出 一 个 元 
素 ， 之 后 将 对 其 进行 各 种 处 理 。 此 时 dp 指向 与 最 后 处 理 的 要 素 相 
对 应 的 inode[] 元 素 。 


21~22 ”如 果 发 生 错 误 则 跳 转 至 out。u.u_error 中 可 能 容纳 由 
iget() 等 生成 的 错误 代码 。 


23-24 ”如 采 已 到 路 径 名 的 末尾 ， 则 返回 dp。 假 设 路 径 名 
为 “home/hoge/fuga” 时 ， 此 处 dp 的 值 为 与 “fuga” 对 应 的 inode[] 
76e 


26-29 WR dp 不 为 目录 则 进行 错误 处 理 。 假 设 路 径 名 
为 “/home/hoge/fuga” 时 ， 如 果 “hoge” 不 为 目录 将 引发 错误 。 


30-31 WRX dp 不 有 具备 执行 权限 则 进行 错误 处 理 。 假 设 路 径 名 
为 “home/hoge/fuga”" 时 ， 如 果 对 目录 “hoge” 不 具备 执行 权限 将 引发 


He 


33-40 u.u dbuf 容纳 着 dp 指 同 的 元 素 的 下 一 个 元 素 名 。 假 设 路 
径 名 为 “home/hoge/fuga”， 且 dp 指向 与 “home” 相 对 应 的 inode[] 
元 素 时 ，u.u_dbuf 的 值 为 "hoge”。 由 于 u.u_ dbuf 只 能 容纳 
DIRSIZ 〈=14。 代 码 清单 9-26) 个 字符 ， 之 后 的 字符 将 被 忽略 。 如 
果 不 到 14 个 字符 ， 那 么 剩余 的 字符 将 用 NULL COD 填充 。 


代码 清单 9-26 DIRSIZ (param.h) 























1 #define DIRSIZ 14 


41-42 ”忽略 重复 的 /字符 。 


43~44 ”如 果 设 定 了 u.u_error， 则 进行 错误 处 理 。u.u_error 中 
可 能 容纳 由 uchar() 等 生成 的 错误 代码 。 


假设 路 径 名 为 “homehoge/fuga”， 且 dp 指 癌 与 “home” 相 对 应 的 
inode[] 元 素 时 ， 此 时 u.u dbuf 的 值 为 “hoge\0\0\0...”， 而 
u.u_dirp 指向 “fuga" 头 部 的 他。 


46-51 由 于 dp 指 癌 与 目录 相对 应 的 inode[] 元 素 ， 此 后 将 从 dp 

代表 的 目录 的 对 应 表 中 寻找 与 u.u_dbuf 容纳 的 元 素 名 相对 应 的 记 

录 ， 因 此 在 此 处 首先 进行 初始 化 设 定 。u.u_count 表示 目录 对 应 表 
中 的 记录 数 。 因 为 目录 的 文件 长 度 等 于 记录 数 x16〈 字 节 ) ， 所 以 

将 文件 长 度 除 以 16 CDIRSIZ420 即 可 得 到 记录 数 。 


53 此 后 为 检查 目录 对 应 表 中 一 条 记录 的 处 理 。 


55 ” 当 检 查 完 所 有 记录 也 未 找到 与 u.u_dbuf 容纳 的 元 素 名 相对 应 
的 记录 时 的 处 理 。 每 处 理 一 条 记录 后 将 递减 u.u_count (第 80 
119/58 


56-57 WMA bp 有 块 设备 缓冲 区 ， 则 释放 该 缓冲 区 。 第 74 行 的 bp 
有 可 能 被 赋予 块 设备 缓冲 区 。 


58 WR flag 为 1( 试 图 生成 文件 或 目录 时 ) ， 且 u.u_dirp 指 
癌 路 径 末 尾 时 的 处 理 。 假 设 路 径 名 为 “homehoge/fuga”， 且 dp 指 
向 与 hoge 相对 应 的 inode[] 元 素 。u.u_dbuf 的 值 

为 “fuga\0\0...”， 而 u.u_dirp KERE fuga ji) 。 此 时 
目录 “/home/hoge” 中 生成 名 为 “fuga” 的 文件 或 目 





























59-60 WR dp 与 目录 相对 应 的 inode[] 元 素 ， 在 此 目录 中 试 
图 生成 新 的 文件 或 目录 ) 不 具备 写 入 权限 将 引发 错误 。 


> 将 u.u pdir 设 定 为 dp， 此 处 的 u.u_pdir 将 使 用 在 别 的 函数 





62~64 如果 eo 的 值 不 为 0， 则 将 u.u offset[1] 设 为 由 eo WE 





16《〈 字 节 ) 后 的 值 。 因 为 eo 指 同位 于 dp 代表 的 目录 对 应 表 中 空 记 
录 之 后 的 记录 ， 减 去 16《〈 一 条 记录 的 长 度 ) 后 将 指 网 空 记录 的 起 
始 位 置 。 如 果 eo 的 值 为 0， 即 当 目 录 对 应 表 中 不 存在 空 记录 时 ， 
设置 dp 的 inode 更 新 标志 位 。 


67~68 如 果 在 目录 的 记录 中 未 找到 对 象 记录 ， 将 引发 ENOENT 错 
误 。 


71 当 u.u offset[1] 指向 块 (512 字 节 ) 的 边界 时 的 处 理 。 请 
注意 ， 在 首次 遍历 某 个 目录 的 记录 时 一 定 会 执行 此 处 理 。 


72~73 WR bp 已 持 有 块 设备 缓冲 区 ， 则 释放 。 

74-75 ” 读 取 下 一 个 块 。 

78 ”从 块 设备 缓 冲 区 同 u.u dent 复制 目录 对 应 表 中 的 一 条 记 

录 。u.u_ dent.u_ino 表示 inode 2$, u.u dent.u name 表示 文 


件 或 目录 名 。 


79 将 u.u_offset[1] 与 16 (一 条 记录 的 长 度 ) 相 加 。 每 处 理 一 
条 记录 ， 就 将 u.u_offset[1] 的 值 增 加 16. 


80 ”递减 u.u_count。 每 处 理 一 条 记录 ， 束 将 u.u count 的 值 减 
2d 











81 u.u dent.u ino 为 0〈 即 空 记录 ) 时 的 处 理 。 


82-84 WR eo 的 值 为 0， 则 将 eo 设 定 为 u.u_offset[1]， 使 eo 
指 回 当前 目录 对 应 表 中 空 记录 之 后 的 一 条 记录 。 返 回 至 eloop fy 
查 下 一 条 记录 。 


86-88 将 u.u dbuf 中 保存 的 字符 串 和 u.u_dent.u_name 中 的 字 
符 串 进行 比较 ， 如 果 不 一 致 则 返回 至 eloop 检查 下 一 条 记 

录 。u.u dent.u_name - u.u dbuf 用 来 计算 u.u_dent.u_name 
和 u.u dbuf 地 址 之 差 ， 加 上 *cp (指向 u.u dbuf 中 的 第 x 个 字 
符 ) 后 即 可 指 同 u.u dent.u name 中 的 第 x 个 字符 。 如 果 字 符 串 
a EAM dp 代表 的 目录 中 找到 了 与 u.u_dbuf 相对 应 的 记 











90-91 ”如果 bp 已 有 块 设备 缓冲 区 ， 则 将 其 释放 。 


92~96 ”如 果 准 备 删 除 文件 或 目录 ， 且 已 到 达 路 径 名 的 末尾 ， 则 检 
人 
返回 dp. 


假设 路 径 名 为 “home/hoge/fuga”， 且 准备 删除 “fuga” 时 ， 确 

认 “hoge” 目 录 下 存在 名 为 “fuga” 的 文件 或 目录 。 如 果 对 “hoge” 具 有 
写 入 权限 则 返回 与 “hoge” 相 对 应 的 inode[] 元 素 。 调 用 namei() 
的 函数 ， 通 过 清除 父 目录 对 应 表 中 相应 记录 的 inode 编号 ， 达 到 删 
除 文件 或 目录 的 目的 。 


97-101 释放 dp 指向 的 inode[ ] 元 素 。 将 在 目录 对 应 表 中 找到 的 
记录 相对 应 的 inodef[ ] 元 素 赋予 dp. 


102 返回 至 cloop. 














access() 


access() 用 来 检查 文件 的 权限 设 定 〈 表 9-23， 代 码 清单 9-27 ) 。 将 由 
参数 指定 的 mode GREW, A, HÍT) 5 inode[] WHI i mode 的 
低位 9 比特 进行 比较 ， 确 认 是 否 具 有 相应 的 权限 。inode.i_mode 的 低 
位 9 比特 表示 文件 的 权限 设 定 ， 从 高 位 开始 以 3 比特 为 1 组 ， 分 别 表示 
文件 拥有 者 、 组 用 户 以 及 其 他 用 户 具 有 的 权限 。 


如 果 是 写 入 ， 那 么 不 能 将 文件 系统 本 身 设置 为 只 读 状 态 。 此 外 ， 作 为 代 
码 段 被 使 用 的 文件 也 不 能 写 入 。 

超级 用 户 Cuser.u uid 为 0 ) 一 定 会 有 权限 。 但 是 如 果 没 有 为 文件 拥 
有 者 、 组 用 户 以 及 其 他 用 户 的 其 中 之 一 设 定 执 行 权 限 ， 那 么 即使 是 超级 
用 户 ， 也 无 法 执行 该 文件 。 


如 果 具 有 权限 则 返回 0， 否则 返回 1。 此 外 ， 权 限 不 足 时 u.u_error 被 
设置 为 错误 代码 。 


表 9-23 access() 的 参数 








inode[] JUR 


处 理 种 类 : 读 取 、 写 入 或 执行 





代码 清单 9-27 access() (ken/fio.c) 


1 access(aip, mode) 
2 int *aip; 


register *ip, m; 


ip = aip; 
m - mode; 
if(m == IWRITE) ( 
if(getfs(ip-»i dev)-»s ronly !- 0) ( 
u.u error - EROFS; 
return(1); 


} 

if(ip->i flag & ITEXT) { 
u.u error = ETXTBSY; 
return(1); 


j 
} 


if(u.u uid == 0) { 


if(m == IEXEC && (ip-»i mode & 
(IEXEC | (IEXEC»»3) | (IEXEC»»6))) == 6) 
goto bad; 
return(0); 


} 

if(u.u uid != ip-»i uid) { 
m =>> 3; 
if(u.u_gid != ip->i_gid) 

m =>> 3; 

} 

if((ip-»i mode&m) !- 0) 
return(0); 


u.u error = EACCES; 
return(1); 











8~17 ”检查 是 否 具 有 写 入 权限 时 的 处 理 。 利 用 getfs() 取得 超级 
检查 是 否 为 只 读 状态 ， 同 时 也 确认 该 文件 不 是 作为 代码 段 的 文 


18-23 ”超级 用 户 的 处 理 。 


24-30 ”根据 权限 检查 对 象 的 inode[] 人 

《文件 拥有 者 、 组 用 户 或 其 他 用 户 ) ， 调 整 参数 mode 的 比特 位 
Ho X inode[] 元 素 的 i_mode 与 参数 E HITS (8O 运算 ， 
如 果 结 果 不 为 0 则 可 确定 用 户 具 有 访问 权限 。 











9.8 初始 化 与 同步 
iinit() 
iinit() 读 取 根 磁盘 的 超级 块 ， 并 将 其 赋予 mount[] 的 第 一 个 元 素 


《代码 清单 9-28 ) 。 该 函数 在 系统 局 动 时 被 main() 调用 ， 且 仅 调 用 一 
次 。 





代码 清单 9-28 iinit() (ken/alloc.c) 


register *cp, *bp; 


(*bdevsw[rootdev.d major].d open)(rootdev, 1); 
bp = bread(rootdev, 1); 
cp = getblk(NODEV); 
if(u.u error) 
panic("iinit"); 
bcopy(bp-»b addr, cp-»b addr, 256); 


brelse(bp); 

mount[0].m bufp = cp; 
mount[0].m dev = rootdev; 
cp = cp-»b addr; 

cp-»s flock = 6; 

Ccp-»s ilock 

cp-»s ronly = 

time[0] = cp-»s time[0]; 
time[1] cp-»s time[1]; 





5 打开 根 磁 盘 的 处 理 。 如 采 是 RK 磁盘 则 不 做 任何 处 理 。 
6 读 取 超级 块 的 内 容 。 


7~11 取得 NODEV 块 设备 的 缓冲 区 ， 将 超级 块 的 内 容 复 制 到 此 组 
冲 区 ， 并 释放 用 来 读 取 超级 块 的 缓冲 区 。 


12~13 ”将 根 磁盘 注册 到 mount[0]. 


14-17 ”对 超级 块 解锁 ， 并 清除 只 读 标 记 。 
18~19 ”将 表示 时 间 的 time 复制 到 超级 块 的 filsys.s_time。 
update() 


update() 用 来 同步 内 存 中 的 数据 和 块 设备 中 的 数据 (代码 清单 9-29 
) 。 该 函数 将 尚未 写 入 块 设备 的 mount[]、inode[] 和 buf[] 的 内 容 
写 入 块 设备 。 


代码 清单 9-29 update() (ken/alloc.c) 


update() 

{ 
register struct inode *ip; 
register struct mount *mp; 
register *bp; 


if(updlock) 
return; 
updlock++; 
for(mp = &mount[0]; mp < &mount[NMOUNT]; mp++) 
if(mp->m bufp != NULL) { 
ip = mp-»m bufp-»b addr; 
if(ip-»s fmod--0 || ip-»s ilock!-e || 
ip-»s flock!-0 || ip-»s ronly!-0) 
continue; 
bp = getblk(mp-»m dev, 1); 
ip-»s fmod - 6; 
ip-»s time[0] = time[0]; 
ip-»s time[1] = time[1]; 
bcopy(ip, bp-»b addr, 256); 
bwrite(bp); 


} 
for(ip = &inode[0]; ip < &inode[NINODE]; ip++) 
if((ip-»i flag&ILOCK) == 0) ( 
ip-»i flag -| ILOCK; 
iupdat(ip, time); 
prele(ip); 


} 
updlock = 6; 
bflush(NODEV); 





7-9 取得 updlock 的 锁 。 如 果 已 被 加 锁 ， 则 不 做 任何 处 理 立 即 返 
回 。updlock 是 用 于 排他 处 理 的 变量 〈 代 码 清 单 9-30) 。 


代码 清单 9-30 updlock (system.h) 


1 int updlock; 


10 3j; mount [ ] 。 


11~15 如果 未 设置 元 系 的 更 新 标志 位 ， 或 已 被 加 锁 ， 或 处 于 只 读 
状态 ， 则 对 该 元 又 不 做 任何 处 理 。 


16 读 取 超 级 块 的 内 容 。 

17 清除 更 新 标志 位 。 

18-19 ”更 新 超级 块 的 filsys.s_time。 

20~21 将 超级 块 的 内 容 复 制 到 缓冲 区 ， 并 将 缓冲 区 的 内 容 写 入 块 


设备 





23-28 Wj inode[]. 。 如 有 果 元 素 未 被 加 锁 ， 则 加 锁 后 调用 
iupdat()， 将 inode[] 元 素 的 内 容 写 入 块 设 备 。 


29 释放 updlock 上 的 锁 。 


30 调用 bflush() 刷新 块 设备 的 缓冲 区 。 因 为 参数 为 NODEV， 所 
以 会 刷新 所 有 设备 的 块 设备 缓冲 区 。 


9.9 小结 

块 设备 的 结构 通过 文件 系统 得 以 抽象 化 。 

数据 通过 文件 、 目 录 以 及 树 状 结构 的 命名 空间 进行 管理 。 

文件 用 来 表现 数据 本 身 ， 而 目录 是 用 来 管理 一 层 文件 或 目录 的 容 














目录 具有 与 文件 相同 的 实体 。 目 录 持 有 下 一 层 文件 或 目录 的 inode 
编号 和 文件 名 。 


可 以 对 文件 或 目录 设 定 访问 权限 。 
通过 挂 载 或 凶 载 可 以 导入 或 除去 多 个 块 设备 的 文件 系统 。 


块 设备 的 区 域 可 分 为 以 下 4 种 : 局 动用 区 域 、 超 级 块 、inode 区 域 
和 存储 区 域 。 


超级 块 用 来 管理 块 设备 的 控制 信息 。 

inode 用 来 管理 文件 的 定义 信息 。 

存储 区 域 的 块 用 来 保存 数据 本 里。 

文件 的 实体 由 1 个 inode 和 多 个 存储 区 域 的 块 组 成 。 
文件 使 用 的 存储 区 域 的 块 可 通过 inode 的 映射 获取 。 


从 inode 到 存 取 区 域 的 映射 分 为 以 下 3 种 : 直接 参照 、 间 接 参 照 和 
双重 间接 参照 。 


未 使 用 inode 和 存储 区 域 的 未 使 用 块 由 超级 块 的 空间 队 列 管理 。 
通过 重复 下 述 处 理 可 以 从 路 径 名 获取 相应 文件 〈 的 inode) : 首先 


取得 路 径 名 中 的 一 个 元 素 ， 然 后 取得 目录 对 应 表 相 应 记录 中 的 
inode， 再 取得 路 径 名 中 的 下 一 个 元 素 。 




















第 10 章 文件 处 理 


10.1 用 户 程序 对 文件 的 处 理 
用 户 程序 处 理 文件 时 ， 流 程 如 下 所 示 。 


和 
述 符 。 


2 UNDE 术 符 读 写 文 件 ， 或 调整 文件 的 偏 移 量 〈 读 写 文件 的 位 





3. 处 理 完毕 后 关闭 文件 。 
如 果 用 C 语言 进行 描述 ， 上 述 流程 可 以 表现 为 代码 清单 10-1 的 代码 。 
代码 清单 10-1 文件 处 理 的 示例 代码 


main() { 
int fd; 
char buf[100]; 
fd = open("filename.txt", 2); 
read(fd, buf, 10); 


seek(fd, 0, 0); 
write(fd, buf, 10); 


1 

2 

3 

4 

5 

6 buf[0] = "a"; 
7 

8 

9 close(fd); 
0 


10 j 





4 将 文件 路 径 作为 参数 ， 以 读 写 模式 打开 ， 如 果 成 功 则 返回 文件 
描述 符 。 


5 将 位 于 文件 头 部 的 10 字 节 数据 读 入 buf. 
6 更 新 读 取 的 数据 。 


7. KRT ERE B] S8 OC PEE DEL EL. 
8 将 更 新 后 的 数据 写 入 文件 。 
9 关闭 文件 ， 结 束 对 文件 的 处 理 。 


open()、read()、seek()、write()、close() 是 由 C 语言 库 提供 的 
操作 文件 的 函数 。 这 些 函 数 通过 执行 系统 调用 处 理 文 件 。 


10.2 3 个 结构 体 


文件 处 理 通 过 3 个 结构 体 管理 。user.u_ofile[] 负责 管理 由 进程 打开 
UE file£ sa Htc file[] 用 来 管理 已 被 打开 的 文件 的 处 理 
E m 10-2, ¥ 10-12 . inode[] 表示 读 取 到 内 存 的 inode 


Fi 


因为 每 一 个 file[] 元 素 部 各 自持 有 文件 偏 移 量 和 文件 访问 模式 ， 所 以 
即使 有 两 个 进程 同时 打开 同一 文件 ， 且 其 中 一 个 进程 将 文件 侦 移 量 同 前 
移动 ， 也 不 会 对 由 为 一 个 进程 打开 的 文件 的 文件 偏 移 量 产 生 影 响 。 


当 进 程 打 开 某 个 文件 之 后 ， 该 进程 被 赋予 user.u_ofile[] 和 file[] 
的 元 素 ， 且 user.u_ofile[] WAHI file[] 元 素 ， 而 file[] TA 
指向 inode[] 元 素 (图 10-1)。 user.u ofile[] 的 数组 下 标 将 返还 
给 用 户 程序 ， 该 下 标 被 彩 水 为 文件 描述 。 用 户 程序 通过 文件 描述 符 对 文 
件 进 行 操作 。 


关闭 文件 时 ， 与 打开 文件 时 相反 ， 将 释放 user.u ofile[]. file[] 
和 inode[] 元 素 。 














进程 1 


user.u ofilef[] file[] inodel] 






进程 2 


user.u. ofile[] 


图 10-1 打开 文件 
代码 清单 10-2 file (file.h) 


struct file 


1 


char f flag; 
char f count; 
int f inode; 
char *f offset[2]; 


) file[NFILE]; 


/* flags */ 

#define FREAD 01 
#define FWRITE 02 
#define FPIPE 04 





K 10-1 file 结构 体 


xu 
nb» 
x 


成 








标志 位 








以 读 取 模 式 打 开 。 不 具备 文件 的 读 取 权 限时 无 法 以 此 模式 打开 文件 








以 写 入 模式 打开 。 不 具备 文件 的 写 入 权限 时 无 法 以 此 模式 打开 文件 


—P"m 





标准 输入 输出 


当 系 统 启动 和 用 户 登 录 时 ， 执 行 打开 终端 的 处 理 。user.u_ofile[] 的 
第 0 个 元 素 被 用 作 标 准 输入 、 第 工 个 元 素 被 用 作 标准 输出 ， 而 第 2 个 元 
素 被 用 作 标 准 错误 输出 (图 10-2) 


user.u ofile[] 


标准 输入 5 m 


系统 启动 或 登录 时 
打开 终端 





图 10-2 标准 输入 输出 


通过 更 改 user.u_ofile[] 的 第 0~2 个 元 素 ， 可 以 实现 重 定向 或 管道 
功能 。 比 如 关闭 user.u ofile[1]. 并 将 其 设 定 为 普通 文件 后 ， 程序 
癌 标 准 输出 写 入 的 内容 ， 将 被 输出 全 该 文件 《图 10- 3 E 管道 的 内 容 
请 参照 第 11 章 。 类 似 这 种 改变 输出 对 象 的 处 理 ， 过 Shell 程序 进 
8. 













程序 以 为 是 向 标 
准 输出 (终端 ) 
输出 数据 实际 数据 被 


输出 到 文件 
K| 10-3 EEM 


10.3 文件 的 生成 和 打开 处 理 
文件 的 生成 和 打开 基本 由 共用 处 理 实现 。 
系统 调用 creat 


系统 调用 creat 生成 新 的 文件 ， 并 将 其 打开 。 该 文件 已 存在 时 ， 将 文 
件 长 度 设 定 为 0 并 将 其 打开 。creat() 为 系统 调用 creat 的 处 理 函 数 
( 表 10-3， 代 码 清单 10-3 . 


表 10-3 系统 调用 creat 的 参数 


EIN 
文件 打开 模式 。 与 inode.i_mode 对 应 。 文 件 已 存在 时 不 使 用 


代码 清单 10-3 creat() (ken/sys2.c) 











1 

2 

3 register *ip; 

4 extern uchar; 

5 

6 ip = namei(&uchar, 1); 

7 if(ip == NULL) ( 

8 if(u.u error) 

9 return; 
10 ip = maknode(u.u arg[1]807777&(^ISVTX)); 
11 if (ip--NULL) 

12 return; 

13 openi(ip, FWRITE, 2); 
14 ) else 

15 openl(ip, FWRITE, 1); 








6 尝试 获取 与 用 户 程序 设 定 的 路 径 相 对 应 的 inode[] 7638 - 


7~13 ”如 果 通 过 namei() 无 法 取得 inode[] 元素， 则 尝试 生成 新 
的 文件 。 将 maknode() 的 参数 设 定 为 用 户 程序 指定 的 模式 。 但 
是 ， 由 于 清除 了 模式 的 高 位 比特 (010000 UE) ， 因 此 无 法 生成 
目录 (IFDIR=040000)〉 ， 也 无 法 设 定 Sticky bit. 


生成 文件 后 执行 open1()。open1() 是 生成 并 打开 文件 的 共用 函 
数 ， 第 3 个 参数 的 2 表示 正在 生成 新 的 文件 。 


14~15 ”如 果 通 过 namei() 成 功 取得 inode[] 元 素 ， 则 使 用 该 元 
i open1() 的 第 3 个 参数 的 1 表示 正在 对 已 存在 的 文件 进行 初始 
处 理 。 





maknode() 


maknode() 用 来 生成 新 的 文件 〈 表 10-4， 代 码 清单 10-4 ) 。 首 先 执行 
ialloc() 从 空闲 队列 中 获取 inode[] 元 素 ， 执 行 wdir() 向 目录 的 对 
应 表 追 加 记录 ， 然 后 将 inodef[ ] 元 素 返 还 给 调用 者 。 


K 10-4 maknode() 的 参数 











准备 生成 的 文件 的 模式 ， 对 应 inode.i_mode 





代码 清单 10-4 maknode() (ken/iget.c) 





aknode (mode) 


m 
{ 
register *ip; 
ip = ialloc(u.u pdir-»i dev); 
if (ip--NULL) 
return(NULL); 


1 
2 
3 
4 
5 
6 
7 
8 ip-»i flag -| IACC|IUPD; 


9 ip-»i mode - mode|IALLOC; 


10 ip-»i nlink = 1; 

11 ip-»i uid = u.u uid; 
12 ip-»i gid - u.u gid; 
13 wdir(ip); 

14 return(ip); 

15 ) 





597 u.u pdir 指 癌 准备 在 其 中 生成 新 文件 的 目录 。u.u_pdir 由 
fr maknode() 之 前 执行 的 namei() WE. 


wdir() 

wdir() 同 目 录 的 对 应 表 中 追加 新 的 记录 ( 表 10-5， 代 码 清单 10-5) 。 
通过 namei()， 将 追加 对 象 的 父 目录 、 追 加 对 象 的 文件 或 目录 名 ， 以 及 
父 目 录 对 应 表 中 的 偏 移 量 设置 在 user 结构 体 中 (图 10-4) ) 。 


用 u.u_pdir 表 示 的 目录 


















inode 编号 文件 或 目录 名 
2 字 节 14 字 节 


u.u offset —> 


u.u dent.u ino  u.u dent.u name 


通过 namei) i XE | ———— — — — — —»u.u. dbuf 
图 10-4 wdir() 


由 于 目录 的 实体 是 文件 ， 因 此 采取 了 与 文件 相同 的 方法 调用 writei() 
更 新 目录 数据 。 


K 10-5 wdir() 的 参数 


| || 








参数 含义 


register char *cp1, *cp2; 


u.u dent.u ino - ip-»i number; 

cp1 = &u.u dent.u name[0]; 

for(cp2 = &u.u dbuf[0]; cp2 < &u.u dbuf[DIRSIZ];) 
*cp1++ = *cp2++; 

u.u_count = DIRSIZ+2; 

u.u_segflg = 1; 

u.u_base = &u.u_dent; 

writei(u.u pdir); 

iput(u.u pdir); 





14 对 于 在 其 中 奶 加 文件 或 目录 的 目录 ，namei() 递增 了 它 的 参照 
计数 器 ， 此 处 则 递减 该 计数 吉 。 


系统 调用 open 


系统 调用 open 用 于 打开 文件 。open() 是 系统 调用 open 的 处 理 函 数 
( 表 10-6， 代 码 清单 10-6 ) 。 


表 10-6 系统 调用 open 的 参数 




















u.u_arg[1] | 打开 文件 时 的 模式 。 如 果 不 具 备 该 模式 的 权限 则 无 法 打开 文件 








C) 


代码 清单 10-6 open() (ken/sys2.c) 


register *ip; 
extern uchar; 


ip = namei(&uchar, 0); 


if(ip -- NULL) 
return; 
u.u_arg[1]++; 
open1(ip, u.u arg[1], 0); 











6~8 ” 演 试 取得 与 用 户 程 序 指定 的 路 径 名 相对 应 的 inode[ ] 元 素 。 


9 系统 调用 open 的 参数 mode， 它 的 可 选 值 如 下 : 0 为 读 取 ，1 为 
写 入 。 对 file 结构 体 的 标志 变量 而 言 ， 则 是 1 为 读 取 ，2 为 写 
入 ， 因 此 需要 在 此 处 加 1 进行 调整 。 


10 执行 open1()， 进 行 生 成 及 打开 文件 的 共用 处 理 。 第 3 个 参数 
的 0 表示 试图 打开 已 存在 的 文件 。 





open1() 
open1() 用 来 执行 生成 及 打开 文件 的 共用 处 理 〈 表 10-7， 代 码 清单 10- 
了 

















试图 打开 已 存在 的 文件 时 执行 access()， 以 检查 是 否 具有 访问 权限 。 
生成 新 文件 时 ， 执 行 itrunc() 将 文件 的 长 度 设 置 为 0。 


随后 ， 执 行 falloc() 从 user.u_ ofile[] 和 file[] 中 取得 新 的 元 
素 ， 将 file[] 元 素 指 同 与 准备 打开 的 文件 相对 应 的 ijnode[ ] 元 素 。 


表 10-7 open10 的 参数 


inode[] JUR 














准备 读 取 文件 ， 还 是 写 入 文件 






































0: 准备 打开 已 存在 的 文件 。1 : 准备 4 该 文件 已 经 存在 。2 : 
准备 生成 新 的 文件 ， 但 该 文件 不 存在 




















代码 清单 10-7 open1() Cken/sys2.c) 





1 openl(ip, mode, trf) 


2 int *ip; 

3 { 

4 register struct file *fp; 

5 register *rip, m; 

6 int i; 

7 

8 rip = ip; 

9 m = mode; 
10 if(trf !- 2) { 
11 if(m&FREAD) 
12 access(rip, IREAD); 
13 if(m&FWRITE) ( 
14 access(rip, IWRITE); 
15 if((rip-»i mode&IFMT) == IFDIR) 
16 u.u error - EISDIR; 
17 ) 
18 
19 if(u.u error) 
20 goto out; 
21 if(trf) 
22 itrunc(rip); 
23 prele(rip); 
24 if ((fp = falloc()) == NULL) 
25 goto out; 
26 fp-»f flag - m&(FREAD|FWRITE); 
27 fp-»f inode - rip; 
28 i = u.u are[Re]; 
29 openi(rip, m&FWRITE); 

30 if(u.u error == 0) 


31 return; 


32 u.u ofile[i] = NULL; 


33 fp-»f count--; 
34 

35 out: 

36 iput(rip); 

37 





10-18 文件 已 存在 时 检查 相应 的 访问 权限 。 准 备 读 取 文 件 时 检 碍 














古 侍 具有 读 取 权限 ， 准 备 写 入 文件 时 则 检查 是 否 具 有 写 入 权限 。 但 
是 不 允许 对 目录 进行 写 入 。 


19-20 没有 访问 权限 时 ， 在 access() 内 将 错误 代码 赋予 


u.u error. 


21-22 如果 系统 调用 creat 处 于 执行 中 的 状态 ， 则 执行 
itrunc() 将 文件 长 度 设 定 为 0。 


23 将 inode[] 元 素 解 锁 。 该 元 素 在 ialloc() 或 namei() 执行 
的 iget() 中 被 加 锁 。 


24-27 从 user.u ofile[] 和 file[] 取得 新 的 元 素 。 

28 在 falloc() 执行 的 ufalloc() 中 ， 将 用 户 进程 的 re 设 定 为 
从 user.u_ofile[] 中 取得 的 元 素 的 数组 下 标 。 这 个 值 将 被 返还 给 
用 户 进程 。 如 果 在 此 后 的 处 理 中 发 生 错误 ， 则 需要 在 第 32 行 释放 

user.u ofile[] 元 素 ， 因 此 ， 此 处 将 下 标 暂 时 保存 于 1i 

29 执行 openi()。 如 果 是 一 般 文 件 则 不 做 任何 处 理 。 

30-31 ”如 果 在 openi() 中 未 发 生 错误 ， 则 认为 处 理 成 功 ， 返 回调 
用 者 。 


32~36 ”如 果 在 openi() 中 发 生 错 误 ， 则 释放 从 user.u ofile[] 
中 取得 的 元 素 ， 并 递减 file[] WAM inode[] 元 素 的 参照 计数 
due 


falloc() 


falloc() 用 来 分 配 user.u_ofile[] 和 file[] 的 元 素 (代码 清单 
10-8) 。 首 先 ， 调 用 ualloc() 取得 user.u_ofile[] 的 元 素 ， 然 后 寻 
找 file[] 的 空 亲 元素。 如果 发 现 空闲 元 素 ， 则 将 通过 ualloc() 取得 
的 user.u_ofile[] 元 素 指向 该 file[ ] 元 素 。 





代码 清单 10-8 falloc() (ken/fio.c) 


register struct file *fp; 
register i; 


if ((i = ufalloc()) < 0) 
return(NULL); 
for (fp = &file[0]; fp « &file[NFILE]; fp++) 
if (fp-»f count--0) ( 
u.u ofile[i] = fp; 
fp-»f counte*; 
fp-»f offset[0] 0; 
fp-»f offset[1] 0; 
return(fp); 
} 
printf("no file\n"); 
u.u error = ENFILE; 
return(NULL) ; 





67 从 user.u ofile[] 中 取得 空闲 元 素 。ufalloc() 返回 所 取 
得 的 user.u_ofile[] 元 素 的 数组 下 标 。 


8~15 ”寻找 file[] 的 空闲 元 素 〈 参 照 计 数 器 的 值 为 0) 。 找 到 后 
将 刚才 取得 的 user.u ofile[] 元 素 的 值 设 定 为 指 辕 该 file[] 元 
素 的 指针 ， 然 后 递增 file] 元 素 的 参照 计数 器 ， 并 将 文件 中 偏 移 
量 的 初始 值 设 定 为 0。 


16~18 ”如 果 在 file[ ] 中 未 找到 空 亲 元素， 则 进行 错误 处 理 。 





ufalloc() 


ufalloc() A user.u ofile[] 中 取得 新 的 元 素 〈 代 码 清单 10-9) . 
该 函数 在 user.u ofile[] 中 寻找 空闲 元 素 ， 找 到 后 将 该 元 素 的 数组 下 


TNT HIP ERR ro, JP FEME AE IL EGROVS Z8 3] FH E e 
代码 清单 10-9 ufalloc() (ken/fio.c) 


falloc() 


register i; 


for (i20; i«NOFILE; i++) 
if (u.u ofile[i] == NULL) ( 


u.u are[Re] = i; 
return(i); 
} 
u.u error = EMFILE; 
return(-1); 





openi() 


openi() 在 对 象 为 特殊 文件 时 执行 打开 设备 的 处 理 〈 表 10-8， 代 码 清单 
10-10 ) 。 如 果 对 象 为 一 般 文 件 ， 则 不 做 任何 处 理 。 


K 10-8 openi() 的 参数 


参数 "X 


di | iii 





























4 register *rip; 
5 register dev, maj; 


6 
7 rip - ip; 
8 dev = rip-»i addr[60]; 


9 maj rip-»i addr[0].d major; 

10 switch(rip-»i mode&IFMT) { 

11 

12 case IFCHR: 

13 if(maj >= nchrdev) 

14 goto bad; 

15 (*cdevsw[maj].d open)(dev, rw); 
16 break; 

17 

18 case IFBLK: 

19 if(maj »- nblkdev) 

20 goto bad; 

21 (*bdevsw[maj].d open)(dev, rw); 
23 } 

23 return; 

24 

25 bad 

26 u.Uu error = ENXIO; 

27 ) 





8-9 如 果 是 特殊 文件 ，inode.i_addr[e8] 会 被 设置 为 设备 编号 。 
为 了 使 用 设备 驱动 表 中 相应 的 设备 驱动 ， 此 处 会 获取 设备 的 大 编 


sTo 


10-23 检查 ijnode.i mode。 如 果 是 特殊 文件 则 执行 打开 设备 的 
处 理 。IFCHR 表示 字符 设备 ，IFBLK 表示 块 设备 。 


10.4. 文件 的 读 取 和 写 入 
系统 调用 read、write 


read() 是 系统 调用 read 的 处 理 函 数 〈 表 10-9， 代 码 清单 10-11 , ix 
系统 调用 用 于 读 取 文件 。write() 是 系统 调用 write 的 处 理 函 数 GRE 
10-10， 代 码 清单 10-120 ， 该 系统 调用 用 于 将 数据 写 入 文件 。 


文件 的 读 取 与 写 入 在 数据 的 流动 方 回 上 是 相反 的 (内 存 磁盘， 及 磁盘 
一 内存) ， 但 是 处 理 本 映 基 本 上 是 相同 的 (图 10-5 ) 。 相 同 的 处 理 部 
分 由 rdwr() 实现 。read() 和 write() 只 是 将 file 结构 体 的 标志 位 
FREAD 和 FWRITE 作为 参数 调用 rdwr( )。 











数据 流向 相反 ， 但 是 
处 理 本 身 基本 相同 





图 10-5 read 和 write 
410-9 系统 调用 read 的 参数 


含义 





u.u arg[0] 存放 读 取 数据 的 虚拟 地 址 (以 字 节 为 单位 ) 


"— 








代码 清单 10-11 read() (ken/sys2.c) 





表 10-10 系统 调用 write 的 参数 


文件 描述 符 


存放 写 入 数据 的 虚拟 地 址 〈 以 字 节 为 单位 ) 
数据 传送 量 《〈 以 字 贡 为 单位 ) 


代码 清单 10-12  write() (ken/sys2.c) 











rdwr() 


rdwr() 用 来 实现 read() 和 write() 的 共用 处 理 〈 表 10-11， 代 码 清 
% 10-13 . P757ju.u base. u.u count. u.u offset 和 


u.u segflg 设 定 适 当 的 值 ， 然 后 调用 readi() fll writei(). 


用 户 进程 的 re 被 设 定 为 实际 让 这 个 值 将 作为 系统 
调用 的 返回 值 。 用 户 程序 可 通过 返回 值 来 判断 读 写 处 理 是 人 否 正 党 结束 。 


K 10-11 rdwr0 的 参数 











dwr (mode) 


register *fp, m; 


m - mode; 
fp = getf(u.u are[Re]); 
if(fp == NULL) 
return; 
if((fp-»f flag&m) -- 0) ( 
u.u error - EBADF; 
return; 
} 
u.u base = u.u arg[0]; 
u.u count - u.u arg[1]; 
u.u segflg - 
if(fp-»f flag&FPIPE) { 
if(m--FREAD) 
readp(fp); else 
writep(fp); 
) else ( 
u.u offset[1] 
u.u offset[0] 
if(m--FREAD) 
readi(fp-»f inode); else 
writei(fp-»f inode); 
dpadd(fp-»f offset, u.u arg[1]-u.u count); 


fp-»f offset[1]; 
fp-»f offset[0]; 


u.u are[Re] = u.u arg[1]-u.u count; 


29 ) 


6-8 执行 getf()， 取 得 与 文件 描述 符 相 对 应 的 file[] 7638 


9~12 将 file[] 元 素 的 标志 位 和 通过 参数 设 定 的 读 写 模式 相 比 
较 ， 确 认 是 否 具有 所 需 的 权限 。 


13~15 为 了 执行 readi() 和 writei()， 首 先 设 定 
u.u base. u.u count 和 Uu.u_segflg。 


16-19 ”如 果 准 备 读 写 的 文件 为 管道 时 的 处 理 。 请 参照 第 11 章 。 


20-27 ”如 果 准 备 读 写 的 文件 为 一 般 文件 时 的 处 理 。 将 

u.u offset 设 定 为 file[] 元 素 的 文件 偏 移 量 。 到 此 为 止 ， 所 需 
的 参数 都 已 设置 完毕 ， 可 以 执行 readi() 或 writei()。 执 行 结束 
后 ， 将 file[] 元素 的 文件 偏 移 量 加 上 实际 读 写 的 字 节 数 。 


28 ”将 用 户 进 程 的 re 设 定 为 实际 读 写 的 字 市 数 ， 并 将 其 作为 系统 
调用 的 返回 值 。 











readi() 


readi() 用 于 读 取 文件 〈 表 10-13， 代 码 清 单 10-14 ) 。 地 址 和 传送 量 
等 参数 通过 user 结构 体 进行 设 定 〈 表 10-12 ) 。 

执行 bmap()， 将 逻辑 块 编号 变换 为 物理 块 编号 ， 并 以 块 单位 (512 字 
TO 进行 读 取 操作 。 如 果 是 对 分 散在 8 个 块 中 长 度 为 4KB 的 数据 进行 


读 取 ， 需 要 读 取 8 次 。 


readi() 具有 预 读 取 的 功能 。 如 果 判 断 正 在 对 某 个 文件 的 块 进行 连续 读 
取 时 ， 将 通过 breada() 进行 异步 的 预 读 取 处 理 。 


表 10-12 readi() 的 参数 





u.u base 存放 读 取 数据 的 虚拟 地 址 (以 字 节 为 单位 ) 


ewe petenti oem 
— 





























1 ， 读 到 到 内核 空间 ，0 ， 计 到 到 用户 


表 10-13 readi() 的 参数 





1 readi(aip) 
2 struct inode *aip; 


int *bp; 

int lbn, bn, on; 

register dn, n; 

register struct inode *ip; 


ip - aip; 
if(u.u count == 0) 
return; 


ip-»i flag -| IACC; 

if((ip-»i mode&IFMT) == IFCHR) ( 
(*cdevsw[ip-»i addr[0].d major].d read)(ip-»i addr[0]); 
return; 


do ( 
lbn = bn = l1shift(u.u offset, -9); 
on = u.u offset[1] & 0777; 
n = min(512-on, u.u count); 
if((ip-»i mode&IFMT) != IFBLK) ( 


23 dn = dpcmp(ip-»i size080377, ip-»i sizel, 


24 u.u offset[0], u.u offset[1]); 
25 if(dn <= 0) 

26 return; 

27 n = min(n, dn); 

28 if ((bn = bmap(ip, lbn)) == 0) 
29 return; 

30 dn = ip-»i dev; 

31 ) else { 

32 dn = ip-»i addr[0]; 

33 rablock = bn-«1; 

34 

35 if (ip-»i lastr41 == lbn) 

36 bp = breada(dn, bn, rablock); 
37 else 

38 bp = bread(dn, bn); 

39 ip-»i lastr = lbn; 

40 iomove(bp, on, n, B READ); 

41 brelse(bp); 

42 } while(u.u error--0 && u.u count!-0); 
43 } 





10-11 如 有 果 读 取 的 数据 长 度 为 0 时 ， 不 做 任何 处 理 立 即 返回 。 





12 设置 inodef[ ] 元 素 的 更 新 标志 位 。 


13~16 如果 文件 是 字符 设备 的 特殊 文件 ， 则 调用 该 设备 的 设备 驱 
动 。 


19 通过 文件 偶 移 量 计算 得 到 该 数据 的 馆 辑 块 编号 。 

20 ERNE E 

21 计算 读 取 的 数据 长 度 。 并 对 其 调整 使 其 不 会 跨越 多 个 块 。 
22~30 ”该 取 对 象 为 一 般 文 件 时 的 处 理 。 对 每 次 读 取 的 长 度 做 最 终 
调整 ， 使 其 不 会 超过 文件 的 长 度 。 然 后 执行 bmap()， 取 得 存储 区 
域 的 物理 块 编号 。 将 dn 设 定 为 块 设备 编号 。 


31-34 ”如 果 读 取 对 象 是 块 设备 的 特殊 文件 ， 则 将 dn 设 定 为 块 设备 
编号 ， 并 将 rablock 设 定 为 准备 读 取 的 块 的 下 一 个 块 的 块 编号 。 








35-38 ”如 果 读 取 对 象 为 文件 中 连续 的 逻辑 块 ， 则 执行 breada() 
读 取 当前 准备 读 取 的 块 ， 并 对 下 一 个 块 进 行 异步 的 预 读 取 。 人 否则 执 
fT bread() 进行 一 般 读 取 。 


39 ”为 了 进行 预 读 取 的 判断 ， 将 inode.i_lastr 设 定 为 所 读 取 的 
逻辑 块 编 号 。 


40 ”执行 iomove()， 将 读 取 的 磁盘 数据 从 缓冲 区 复制 到 进程 的 虚 
拟 地 址 。 


41 释放 读 取 数据 时 使 用 的 缓冲 区 。 


42 如果 没有 发 生 错 误 ， 且 需要 的 数据 尚未 读 取 完毕 时 ， 继 续 做 该 
取 处 理 。 





writei() 


writei() 用 于 对 文件 进行 号 入 处 理 〈 表 10-15， 代 码 清单 10-15) . 与 
readi() 相同 ， 地 址 和 传送 量 等 参数 也 通过 user 结构 体 进行 设 定 〈 表 
10-14 ) 。 


执行 bmap()， 将 人 逻辑 块 编写 变换 为 物理 块 编写 ， 并 以 块 单位 (512 F 
TO 进行 写 入 操作 。 如 果 是 对 分 散在 8 个 块 中 长 度 为 4KB 的 数据 进行 
写 入 ， 则 需要 写 入 8 次 。 

如 琳 需 要 对 整个 块 写 入 数据 ， 首 先 执 行 getblk() 取得 该 块 的 缓冲 区 。 
因为 接 下 来 要 对 块 进行 禾 凋 处 理 ， 所 以 此 时 无 需 从 磁盘 读 取 块 中 的 数 
据 。 如 果 只 是 更 新 块 中 的 一 部 分 内 容 ， 则 需要 首先 执行 bread() MAR 
盘 读 取 块 中 当前 的 内 容 ， 然 后 将 需要 更 新 的 那 一 部 分 写 入 缓冲 区 ， 再 写 
入 磁盘 。 

对 磁盘 进行 写 入 时 ， 如 果 遇 到 块 的 边界 数据 ， 将 被 立即 写 入 磁盘 。 人 否则 
将 进行 延迟 写 入 ， 数 据 不 会 马上 写 入 磁盘 。 


K 10-14  writei() 的 参数 

















一 < 


八 备 被 写 入 的 数据 的 虚拟 地 址 〈 以 字 节 为 单位 ) 














u.u base 


文件 中 的 偏 移 量 〈 以 字 节 为 单位 ) 
写 入 的 数据 量 〈 以 字 节 为 单位 ) 


1: 从 内 核 空 间 写 入 ，0 : 从 用 户 空间 写 入 





K 10-15 writei() 的 参数 





1 writei(aip) 
2 struct inode *aip; 


34 

4 int *bp; 

5 int n, on; 

6 register dn, bn; 

7 register struct inode *ip; 

8 

9 ip = aip; 

10 ip-»i flag -| IACC|IUPD; 

11 if((ip-»i mode&IFMT) == IFCHR) { 
12 (*cdevsw[ip-»i addr[0].d major].d write)(ip-»i addr[0]); 
13 return; 
14 } 
15 if (u.u count == 0) 
16 return; 
17 
18 do ( 
19 bn = lshift(u.u offset, -9); 
20 on = u.u offset[1] & 0777; 


21 n = min(512-on, u.u count); 


22 if((ip-»i mode&IFMT) !- IFBLK) ( 


23 if ((bn = bmap(ip, bn)) == 0) 
24 return; 

25 dn = ip-»i dev; 

26 ) else 

27 dn = ip-»i addr[0]; 

28 if(n == 512) 

29 bp = getblk(dn, bn); else 

30 bp = bread(dn, bn); 

31 iomove(bp, on, n, B WRITE); 

32 if(u.u error !- 0) 

33 brelse(bp); else 

34 if ((u.u offset[1]&0777)--0) 

35 bawrite(bp); else 

36 bdwrite(bp); 

37 if(dpcmp(ip-»i size080377, ip-»i size1， 
38 u.u offset[0], u.u offset[1]) < © && 
39 (ip-»i mode&(IFBLK&IFCHR)) -- 0) ( 
40 ip-»i size = u.u offset[0]; 

41 ip-»i sizel1 = u.u offset[1]; 

42 

43 ip-»i flag -| IUPD; 

44 } while(u.u error--0 && u.u count!-0); 
45 } 





10 设置 inode[ ] 元素 的 参照 标志 位 和 更 新 标志 位 。 


11-14 如果 准备 写 入 的 文件 为 字符 设备 的 特殊 文件 ， 则 调用 该 设 
备 的 设备 驱动 。 


15~16 ”如 果 准 备 写 入 的 数据 长 度 为 0， 则 不 做 任何 处 理 。 


19-21 与 readi() 时 的 处 理 相 同 ， 计 算出 逻辑 块 编号 、 块 偏 移 量 
和 写 入 数据 长 度 〈 对 其 进行 调整 使 数据 不 会 跨越 多 个 块 ) 。 


22~25 如果 准备 写 入 的 文件 为 一 般 文 件 时 ， 执 行 bmap() 获取 物 
理 块 编号 ， 并 将 dn 设 定 为 设备 编号 。 


26-27 ”如 果 准 备 写 入 的 文件 为 块 设备 的 特殊 文件 ， 则 将 dn 设 定 为 
设备 编号 。 


28~30 ”如 果 需 要 回 整 个 块 写 入 数据 ， 首 先 执行 getblk() 获取 该 


块 的 缓冲 区 。 如 果 只 是 更 新 块 中 的 部 分 内 容 ， 则 首先 执行 bread() 
从 磁盘 读 取 块 当前 的 内 容 。 


31 执行 iomove() 将 准备 写 入 的 数据 从 虚拟 地 址 空间 传送 至 缓冲 
[X 。 


34-36 ”过 到 块 边界 时 ， 执 行 bawrite() 以 异步 方式 将 数据 立即 写 
入 人 磁盘。 否则 执行 bdwrite() 进行 延迟 写 入 。 


37-42 ”如 果 由 于 写 入 使 文件 长 度 增 大 ， 则 增加 ijnode .i_size 的 
值 。u.u_offset 的 值 为 此 时 文件 末尾 的 地 址 。 


43 设置 inode[ ] 元 素 的 更 新 标志 位 。 


44 如 果 没 有 发 生 错 误 ， 且 需要 的 数据 尚未 写 完 时 ， 继 续 写 入 处 
UM 











iomove() 


iomove() 用 于 在 虚拟 地 址 空间 和 了 块 设备 缓冲 区 之 间 传 送 数据 〈 表 10- 
17， 代 码 清单 10-16 ) . 5 readi() 和 writei() 相同 ， 内 存 地 址 及 传 
送 数 据 长 度 等 通过 user 结构 体 指 定 。 请 注意 ，user 结构 体 的 内 容 将 被 
更 新 〈 表 10-16 ) 。 


当 以 字 为 单位 对 用 户 空间 进行 传送 时 ， 使 用 汇编 语言 编写 的 copyin() 
We 否则 使 用 cpass() 和 passc() 以 字 节 为 单位 进行 传 





K 10-16 iomove() 的 参数 








人 




















u.u offset 


Qo MORES SDN CUN EUM MUE 






































Wf (以 字 节 为 单位 〉，。 处 理 结束 后 将 被 递减 实际 传送 的 长 度 值 





ma 从 内 核 空间 读 写 ，0 : 从 用 户 空间 读 写 


K 10-17 iomove() 的 参数 


块 设备 缓冲 区 








Zt CPI BÉ fee CULTE ZERO 














数据 传送 长 度 〈 以 字 节 为 单位 ) 

















代码 清单 10-16 iomove() (ken/rdwri.c) 





1 iomove(bp, o, an, flag) 
2 struct buf *bp; 


31 

4 register char *cp; 

5 register int n, t; 

6 

7 n-an; 

8 cp = bp-»b addr + o; 

9 if(u.u segflg--0 && ((n | cp | u.u base)801)--0) ( 
10 if (flag--B WRITE) 

11 cp = copyin(u.u base, cp, n); 
12 else 

13 cp = copyout(cp, u.u base, n); 
14 if (cp) ( 

15 u.u error - EFAULT; 

16 return; 


18 u.u base =+ nj 


19 dpadd(u.u offset, n); 

20 u.u count =- n; 

21 return; 

22 } 

23 if (flag==B WRITE) { 

24 while(n--) { 

25 if ((t = cpass()) < 0) 
26 return; 

27 *cp++ = t; 

28 } 

29 } else 

30 while (n--) 

31 if(passc(*cp++) < 0) 
32 return; 

33 } 





9.22 ”从 用 户 空间 传送 数据 。 如 果 传 送 长 度 、 绥 冲 区 内 偏 移 量 、 内 
存 地 址 都 以 字 为 单位 《偶数 ) ， 则 使 用 copyin() 和 copyout()。 


23-32 ”否则 使 用 passc() CK 10-18， 代 码 清单 10-17) 和 
cpass() 【代码 清单 10-18) 。 这 两 个 函数 以 字 节 为 单位 传送 数 
据 ， 如 有 果 是 在 内 核 空 间 内 部 进行 传送 ， 只 需 进 行 单纯 的 数据 复制 即 
可 。 如 果 是 在 用 户 空 间 和 内 核 空间 之 间 传 送 数 据 ， 则 需要 调用 
subyte() 和 fubyte()。 


K 10-18 passc() 的 参数 





参数 





ae 


代码 清单 10-17 passc() (ken/subrc.c) 





1 passc(c) 

2 char c; 

3 { 

4 if(u.u segflg) 

5 *u.u base = c; else 


6 if(subyte(u.u base, c) < e) { 
7 u.u error - EFAULT; 
8 return(-1); 


9 j 

10 u.u count--; 

11 if(*-u.u offset[1] == 0) 

12 u.u offset[0]---; 

13 u.u_base++; 

14 return(u.u count == 0? -1: 0); 
15 ) 


pass() 


C 
{ 


register c; 


if(u.u count == 0) 
return(-1); 
if(u.u segflg) 
C = *u.u base; else 
if((c-fubyte(u.u base)) < e) { 
u.u error - EFAULT; 
return(-1); 
} 
u.u count--; 
if(*-u.u offset[1] == 0) 
u.u offset[0]---; 
u.u_base++; 
return(c&0377); 





getf() 


getf() 根据 用 户 程序 指定 的 文件 描述 符 ， 返 回 对 应 的 
user.u ofile[] 元 素 〈 表 10-19， 代 码 清单 10-19 ) 。 


表 10-19 getf() 的 参数 





f 文件 描述 符 














代码 清单 10-19 getf() (ken/fio.c) 


getf(f) 
1 


register *fp, rf; 


pf of 

if(rf<@ || rf»-NOFILE) 
goto bad; 

fp = u.u ofile[rf]; 

if(fp !- NULL) 
return(fp); 


u.u error - EBADF; 
return(NULL); 





10.5 ”指定 文件 的 读 写 位 置 

系统 调用 seek 

seek() 为 系统 调用 seek 的 处 理 函 数 〈 表 10-20， 代 码 清单 10-20 ) 。 
可 以 以 块 为 单位 (512 字 节 ) 对 偏 移 量 
进行 增 减 。 


首先 根据 文件 描述 符 获取 user.u_ofile[] 指向 的 file[] 元 素 ， 然 后 
SE DOCU DRE TERCIO E 


K 10-20 系统 调用 seek 的 参数 





参数 


Po emen 





cena suman. 单位 为 字 节 或 块 (512 F) 


模式 。 指 定 偏 移 量 增 减 的 起 点 及 单位 〈 字 节 或 块 ) 。0、3 : 文件 的 起 始 
u.u arg[1] | 位 置 。1、4 : 当前 偏 移 量 。2、5 : 文件 的 末尾 位 置 。0~2 时 以 字 节 为 单 



































位 ，3~5 时 以 块 为 单位 。0、3 时 偏 移 量 增 减 值 的 类 型 为 unsigned 











代码 清单 10-20 seek() (ken/sys2.c) 





1 seek() 

2 { 

3 int n[2]; 

4 register *fp, t; 

5 

6 fp = getf(u.u are[Re]); 
7 if(fp == NULL) 

8 return; 

9 if(fp->f_flag&FPIPE) { 
10 u.u_error = ESPIPE; 


11 return; 


12 } 

13 t = u.u arg[1]; 

14 if(t > 2) { 

15 n[1] = u.u arg[0]««9; 

16 n[0] = u.u arg[0]»»?7; 

17 if(t -- 3) 

18 n[0] -& 0777; 

19 ) else ( 

20 n[1] = u.u arg[9]; 

21 n[0] = €; 

22 if(t!-0 && n[1]«0) 

23 n[0] = -1; 

24 } 

25 switch(t) { 

26 

27 case 1: 

28 case 4: 

29 n[0] =+ fp-»f offset[0]; 
30 dpadd(n, fp-»f offset[1]); 
31 break; 

32 

33 default: 

34 n[0] =+ fp-»f inode-»i size08&0377; 
35 dpadd(n, fp-»f inode-»i sizel1); 
36 

37 case 0: 

38 case 3: 

39 $ 

40 } 

41 fp-»f offset[1] = n[1]; 

42 fp-»f offset[0] = n[0]; 

43 ) 





6-8 取得 与 文件 描述 符 相 对 应 的 file[] 元 素 。 
9~12 无 法 调整 管道 的 偏 移 量 。 





14-18 ”如 果 模 式 大 于 等 于 3， 则 将 偏 移 量 的 增 减 值 调 整 为 以 块 为 
单位 。 因 为 模式 为 3 时 偏 移 量 的 增 减 值 的 类 型 必须 为 unsigned， 所 
以 只 取出 数值 的 部 分 。 


19~24 如果 模式 小 于 等 于 2， 偏 移 量 增 减 值 则 以 字 节 为 单位 。 但 
因为 模式 为 1、2 时 增 减 值 的 类 型 为 signed， 所 以 当 增 减 值 为 负数 














时 需要 将 n 的 高 位 字 n[8] 设置 为 -1， 使 n 全 体 都 为 负 值 。 
25 确定 新 的 文件 偏 移 量 。 

27-31 ”以 当前 的 文件 偏 移 量 为 基准 对 数值 进行 增 减 。 
33-35 ”以 文件 长 度 〔 文 件 的 末尾 ) 为 基准 对 数值 进行 增 减 。 


37-39 ”因为 是 以 文件 的 起 始 位 置 为 基准 对 数值 进行 增 减 ， 所 以 不 
需要 进行 特别 处 理 。 


41~42 ”更 新 文件 偏 移 量 。 








10.6 ”关闭 文件 


系统 调用 close 


close() 是 系统 调用 close 的 处 理 函 数 〈 表 10-21， 代 码 清单 10- 
21) ， 用 来 关闭 文件 。 参 数 为 文件 描述 符 ， 系 统 调用 close 将 相应 的 
user.u ofile[] 元 素 设置 为 NULL， 然 后 执行 closef(), XÉJA 
user.u ofile[] 元 素 原 本 指向 的 file[] 元 素 的 参照 计数 器 。 


表 10-21 系统 调用 close 的 参数 

















register *fp; 


fp = getf(u.u are[Re]); 
if(fp == NULL) 
return; 
u.u ofile[u.u are[Re]] = NULL; 
closef(fp); 





closef() 

closef() 用 来 逆 减 file[] 元 素 的 参照 计数 器 的 值 〈《 表 10-22， 代 码 清 
单 10-22 ) 。 当 参照 计数 器 的 值 变 为 0 时 执行 closei(), Xyk file[] 
元 素 指 回 的 inode[ ] 元 素 的 参照 计数 器 的 值 。 


表 10-22 closef() 的 参数 





代码 清单 10-22 closef() (ken/fio.c) 


1 closef(fp) 
2 int *fp; 
3 { 


register *rfp, *ip; 


if(rfp-»f flag&FPIPE) ( 
ip = rfp-»f inode; 
ip-»i mode -& -(IREAD|IWRITE); 
wakeup(ip-1); 
wakeup(ip-*2); 


4 
5 
6 rfp = fp; 
7 
8 


if(rfp-»f count <= 1) 
closei(rfp-»f inode, rfp-»f flag&FWRITE); 
rfp-»f count--; 








7~12 ”文件 为 管道 时 的 处 理 。 请 参考 第 11 章 。 
closei() 
closei() 执行 iput() 递减 inode[] 元 素 的 参照 计数 器 的 值 〈 代 码 清 
单 10-23， 表 10-23) 。 文 件 为 特殊 文件 ， 且 当 参 照 计数 器 的 值 变 为 0 
时 进行 关闭 设备 的 处 理 。 


K 10-23 closei() 的 参数 





ew 读 写 模式 





代码 清单 10-23 closei() (ken/fio.c) 


1 closei(ip, rw) 


register *rip; 
register dev, maj; 


rip - ip; 

dev = rip-»i addr[60]; 

maj = rip-»i addr[0].d major; 
if(rip-»i count <= 1) 
switch(rip-»i mode&IFMT) { 


case IFCHR: 
(*cdevsw[maj].d close)(dev, rw); 
break; 


case IFBLK: 
(*bdevsw[maj].d close)(dev, rw); 


} 
iput(rip); 





10.7? ”目录 的 生成 


系统 调用 mknod 


mknod() 为 系统 调用 mknod 的 处 理 函 数 〈 表 10-24， 代 码 清 单 10-24 
) ， 用 于 生成 目录 或 特殊 文件 。 该 系统 调用 只 有 超级 用 户 才 能 执行 ， 一 
般 用 户 试图 执行 时 不 做 任何 处 理 并 引发 错误 。 


K 10-24 系统 调用 mknod 的 参数 





模式 。 被 赋予 inode.i_mode 
号 。 被 赋予 inode.i_addr[0]。 生 成 目录 时 值 为 0 


代码 清单 10-24 mknod() (ken/sys2.c) 





























1 mknod() 

2 { 

3 register *ip; 

4 extern uchar; 

5 

6 if(suser()) { 

7 ip = namei(&uchar, 1); 
8 if(ip != NULL) { 

9 u.u_error = EEXIST; 
10 goto out; 

11 } 

12 

13 if(u.u error) 

14 return; 

15 ip = maknode(u.u arg[1]); 


16 if (ip--NULL) 


17 return; 


18 ip-»i addr[0] = u.u arg[2]; 
19 

20 out: 

21 iput(ip); 

22 





6 MP INBARBEE. J TEHTE R AWA 
统 会 对 生成 目录 的 命令 mkdir 设置 SUID 标志 位 。 








7-11 利用 namei() 取得 与 用 户 指定 的 路 径 名 相对 应 的 inode[] 
元 素 。 因 为 准备 生成 新 的 文件 或 目录 ， 所 以 如 果 与 路 径 名 相对 应 的 
inode[] 元 素 已 经 存在 ， 则 进行 错误 处 理 。 


13-14 如果 当前 用 户 不 是 超级 用 户 ，suser() 则 会 将 错误 代码 赋 
予 u.u_ error。 另 外 ， 在 namei() 中 出 错时 也 会 将 错误 代码 赋予 
u.u error. 

15-17 执行 maknode() 生成 新 的 文件 。 

18 将 inode.i addr[0] 设置 为 用 户 通 过 参数 指定 的 值 。 


21 生成 文件 或 执行 namei() 时 会 递增 inode[] 元 素 的 参照 计数 
器 的 值 ， 此 处 则 进行 递减 。 





10.8 文件 的 链接 


链接 用 于 实现 所 谓 的 “人 硬 链 接 * (hard link) ， 在 UNIX V6 中 没有 符号 链 
接 的 概念 。 


通过 链接 可 以 对 一 个 文件 (inode + 存储 区 域 的 块 ) 赋予 多 个 名 称 。 例 
如 ， 对 名 为 /var/hoge 的 文件 设 定名 为 /var/homu 的 链接 后 ， 束 可 以 通过 
/Var/hoge 或 /var/homu 的 路 径 名 访问 同一 个 文件 。 


新 旧名 称 具 有 相同 的 作用 。 即 使 删除 了 /var/hoge, /var/homu 仍旧 处 于 
可 参照 的 状态 ， 因 此 文件 本 号 不 会 被 删除 。 文 件 具 有 的 @ 称 的 数量 称 为 
Au inode.i nlink 管理 ,只 要 被 链接 数 的 值 不 为 0, 文 件 就 不 
会 被 删除 。 


与 此 相反 ， 如 果 是 符号 链接 ， 当 删除 原本 的 名 称 “/varhoge" 时 ， 文 件 本 
身 也 会 被 删除 。 符 扎 链 接 具 有 主 从 关系 ， 链 接 〈 从 ) 可 以 被 看 做 仅仅 古 
HARAK (E) 。 


人 硬 链接 存在 若干 问题 。 首 要 问题 是 无 法 跨 设 备 设 定 链接 。 目 录 的 对 应 表 
只 记录 了 inode 编写 和 文件 名 的 信息 ， 只 通过 inode 编写 无 法 判断 该 
inode 属于 哪个 设备 。 


除 此 之 外 ， 无 法 对 目录 设 定 链接 也 是 问题 之 一 。 这 会 使 命名 空间 中 出 现 
循环， 损坏 文件 路 径 的 一 臻 性。 为 了 解决 上 述 问 题 ， 导 入 了 符号 链接 的 


Æ UNIX V6 中 ， 超 级 用 户 可 以 对 目录 设 定 链接 。 出 于 安全 性 的 考虑 ， 
最 近 的 一 些 操作 系统 开始 限制 超级 用 户 设 定 目录 的 链接 。 


系统 调用 link 


link() 为 系统 调用 link 的 处 理 函 数 〈 表 10-25， 代 码 清单 10-25 , 
用 于 设 定 链接 。 如 果 被 链接 的 文件 不 存在 ， 或 与 新 赋予 的 路 径 名 相对 应 
的 文件 已 经 存在 时 将 引发 错误 。 此 外 ， 被 链接 数 的 上 限 为 127， 超 过 此 
数值 时 也 会 引发 错误 。 

















3610-25 系统 调用 link 的 参数 





u.u arg[0] 被 链接 的 文件 的 路 径 名 


u.u arg[1] 新 赋予 的 路 径 名 





代码 清单 10-25 link() (ken/sys2.c) 





1 link() 

2 { 

3 register *ip, *xp; 

4 extern uchar; 

5 

6 ip = namei(&uchar, 0); 

7 if(ip -- NULL) 

8 return; 

9 if(ip-»i nlink >= 127) ( 
10 u.u error - EMLINK; 
11 goto out; 

12 

13 if((ip-»i mode&IFMT)--IFDIR && !suser()) 
14 goto out; 

15 ip-»i flag =& -ILOCK; 

16 u.u dirp = u.u arg[1]; 

17 xp = namei(&uchar, 1); 

18 if(xp !- NULL) { 

19 u.u error = EEXIST; 

20 iput(xp); 

21 } 

22 if(u.u error) 

23 goto out; 

24 if(u.u pdir-»i dev !- ip-»i dev) { 
25 iput(u.u pdir); 

26 u.u error = EXDEV; 

27 goto out; 

28 ) 

29 wdir(ip); 

30 ip->i_nlink++; 


31 ip->i_flag =| IUPD; 


32 

33 out: 

34 iput(ip); 
35 ) 





6-8 取得 与 被 链接 文件 的 路 径 名 相对 应 的 inode[ ] 763 - 
9-12 ”如 采 超 过 链接 数 的 上 限 则 引发 错误 。 


13~14 ”如 果 是 目录 ， 只 有 超级 用 户 才 可 以 设 定 链接 。 


15 解锁 获取 的 inode[] 元 素 。 在 namei() 调用 的 iget() 中 对 
该 元 又 加 锁 。 


16~21 尝试 取得 与 用 户 通过 参数 指定 的 第 2 个 路 径 名 相对 应 的 
inode[] 元 素 。 因 为 希望 用 该 路 径 设 定 链接 ， 所 以 如 果 取 得 了 与 该 
路 径 相 对 应 的 inode[ ] 元 素 〈 即 已 经 存在 同名 的 文件 ) 则 引发 错 
误 。 


22~23” 当 namei() 中 发 生 错误 ， 或 是 取得 了 inode[] 元 素 
时 ，u.u_error 将 被 赋予 错误 代码 。 


24-28 在 不 同 的 设备 之 间 无 法 设 定 链接 。 在 第 17 行 执行 的 
namei() 中 ， 第 2 个 路 径 名 所 指向 的 文件 的 父 目 录 被 赋予 


u.u pdir. 


29 ”将 与 第 1 个 路 径 名 相对 应 的 inode[ ] 元 素 ， 追 加 至 由 第 2 个 

路 径 名 指 问 的 文件 父 目 录 的 对 应 表 中 。 由 于 在 第 17 行 执行 的 

namei() 中 已 将 与 第 2 个 路 径 名 相对 应 的 文件 名 赋予 了 

ene 因此 对 应 表 记 录 中 的 文件 名 是 与 第 2 个 路 径 名 相对 应 
X. ` 


30-31 递增 与 被 链接 文件 相对 应 的 inode[] 元 素 的 被 链接 数 ， 并 
设置 inode[] 元 素 的 更 新 标志 位 。 


34 递减 由 namei() 中 的 ijget() 递增 的 inode[] 元 素 的 参照 计 
数 器 的 值 。 














suser() 


suser() 检 碍 执行 进程 是 否 由 超级 用 户 执行 《代码 清单 10-26 . WR 
执行 者 为 超级 用 户 ，user.u_uid 则 为 0。 


代码 清单 10-26 suser() (ken/fio.c) 


if(u.u uid == 0) 
return(1); 


Uu.U error = EPERM; 
return(0); 





10.9 ”删除 文件 
系统 调用 unlink 


unlink() 为 系统 调用 unlink 的 处 理 函 数 〈 表 10-27， 代 码 清单 10-27 
) ， 用 来 删除 文件 。 目 录 只 有 超级 用 户 才能 删除 。 


删除 文件 是 通过 将 目录 对 应 表 相 应 记录 中 的 inode 编号 设置 为 0 得 以 实 











现 的 。 删 除 某 个 目录 下 名 为 “hoge.txt”* 的 文件 时 的 例子 如 表 10-26 所 示 。 
表 10-26 文件 删除 

















此 外 ， 系 统 调用 unlink 将 递减 inode.i_nlink。 当 :inode.i_nlLlink 
的 值 变 为 0 时， 该 inode 以 及 所 使 用 的 存 取 区 域 将 被 释放 。 但 是 ， 存 储 
区 域 中 保存 的 数据 将 维持 原状 直到 被 其 他 数据 履 盖 。 删 除 文件 可 看 做 是 
消除 了 访问 存储 区 域 的 途径 。 


表 10-27 系统 调用 unlink 的 参数 

















FE ERU XC TER E E 


一 < 


uU.uU_arg[6] 














代码 清单 10-27 unlink() (ken/sys4.c) 


register *ip, *pp; 
extern uchar; 


pp = namei(&uchar, 2); 
if(pp == NULL) 
return; 
prele(pp); 
ip = iget(pp-»i dev, u.u dent.u ino); 
if(ip == NULL) 
panic("unlink -- iget"); 
if((ip-»i mode&IFMT)--IFDIR && !suser()) 
goto out; 
.u offset[1] =- DIRSIZ+2; 
.u base = &u.u dent; 
.U count = DIRSIZ42; 
.u dent.u ino = 6; 
writei(pp); 
ip-»i nlink--; 
ip-»i flag -| IUPD; 


u 
u 
u 
u 


iput(pp); 
iput(ip); 





6~8 将 namei() 的 第 2 个 参数 设 定 为 2， 获 取 与 准备 删除 的 文件 
的 父 目录 相对 应 的 inode[ ] 元 素 。 


9 ”该 元 素 已 由 namei() 加 锁 ， 此 处 对 其 解锁 。 


10~12 ”取得 与 路 径 名 相对 应 的 inode[ ] 元 素 。u.u_dent.u_ino 
己 由 namei() 进行 了 设 定 。 


13-14 如果 不是 超级 用 户 则 无 法 删除 目录 。 但 是 ， 也 存在 其 他 
UNIX 版 本 ， 为 删除 目录 的 命令 rmdir 设 定 SUID 位 ， 使 得 一 般 用 


户 也 可 以 删除 目录 。 

15~19 执行 writei()， 修 改 目 录 对 应 表 。u.u_dent 和 

u.u offset 已 由 namei() 进行 了 设 定 。 因 为 u.u_dent.u_ino 
的 值 为 0， 对 应 表 中 相应 记录 的 inode 编号 也 将 变 为 0。 

20-21 递减 inode[] 元 素 的 被 链接 数 ， 并 设置 更 新 标志 位 。 


24-25 ”递减 与 父 目录 和 被 删除 文件 相对 应 的 inode[ ] 元 素 的 参照 
计数 器 的 值 。 


10.10 ”小 结 


已 打开 的 文件 由 user.u_ofile[]、file[]、inode[]3 个 结构 体 
管理 。 


文件 打开 后 ，user.u_ofile[] 的 数组 下 标 ， 即 文件 描述 符 被 返还 
给 用 户 程序 。 


file[] 用 来 管理 文件 偏 移 量 等 操作 文件 的 数据 。 

read 和 write 的 处 理 以 块 为 单位 进行 。 

删除 文件 等 同 于 将 目录 对 应 表 的 相应 记录 的 inode 编号 设置 为 0。 
通过 链接 可 以 为 文件 设 定 多 个 名 称 。 





11.1 什么 是 管道 


管道 是 在 父 进程 和 子 进程 之 间 通 信和 的 机 制 。 因 为 进程 拥有 各 目 独 立 的 虚 
拟 地 址 空间 ， 所 以 任意 的 进程 是 无 法 直接 访问 其 他 进程 拥有 的 数据 的 。 
为 了 实现 进程 间 的 通信 ， 于 是 设计 了 管道 


管道 对 文件 系统 《的 一 部 分 ) 进行 了 巧妙 应 用 ， 使 得 进程 间 的 通信 成 为 
可 能 。 管 道 首 先 获 取 根 磁盘 的 inode， 然 后 利用 该 node 指向 的 存储 区 域 
进行 数据 交换 。 这 个 文件 (inode 和 存储 区 域 ) 构成 了 管道 的 实体 。 管 
道 的 容量 由 PIPSIZ 定义 ， 缺 省 值 为 4096 字 节 【代码 清单 11-1 ) 。 


代码 清单 11-1 PIPSIZ Cken/pipe.c) 

















1 #define PIPSIZ 4096 


利用 管道 进行 的 通信 流程 如 下 所 示 图 11-1 )〉。 
1. 发 送 方 的 进程 向 管道 写 入 数据 ， 直 到 管道 被 充满 。 


2. 切换 至 接收 方 的 进程 ， 使 得 从 管道 读 入 数据 。 已 经 接收 的 数据 从 管道 
中 被 删除 。 


3. 数据 全 部 读 取 后 ， 切 换 至 发 送 方 的 进程 ， 返 回 1. 的 处 理 。 


发 送 方 以 与 管道 相对 应 的 inode[ ] 元 素 的 地 址 +1、 接 收 方 以 该 地 址 +2 
为 参数 执行 sleep( )。 


管道 
(ipz &inode) 
inode.i size 


write) ^ | read() 
———X | | 一 
1 v 
sleep(ip--1) ; «——inode.i size  Sleep(ip*-2) 
swtch() 
图 11-1 管道 
使 用 管道 的 优点 





在 进程 间 传 递 数 据 也 可 通过 临时 文件 来 实现 (代码 清单 11-2 ) 。 
代码 清单 11-2 ”临时 文件 


1 % ./sender > tmp 
2 % ./receiver < tmp 


与 临时 文件 相 比 ， 使 用 管道 具有 下 述 优 点 。 首 先 ， 可 使 用 的 块 设备 的 资 
源 是 有 限 的 。 管 道 的 容量 为 固定 的 4096 字 节 ， 因 此 即使 用 来 交换 更 大 
容量 的 数据 也 不 会 占用 更 多 的 块 设备 区 域 。 而 使 用 临时 文件 时 ， 会 占用 
与 所 交换 的 数据 相等 容量 的 块 设备 区 域 。 


其 次 ， 管 道 所 需要 的 缓冲 区 的 容量 小 于 缓冲 区 的 总 容量 ， 利 于 发 挥 块 设 
备 缓冲 区 的 缓存 功能 。 而 且 ， 当 发 送 方 的 进程 将 数据 写 入 管道 后 ， 接 收 
方 的 进程 将 马上 进行 读 取 ， 块 设备 的 缓存 效果 会 更 加 明显 。 


与 之 相反 ， 当 使 用 临时 文件 时 ， 如 采 需 要 输出 大 于 块 设备 缓冲 区 容量 的 
文件 ， 绥 冲 区 所 带 来 的 缓存 效果 将 因此 受到 影 啊 。 


但 是 ， 当 使 用 管道 ， 且 执行 进程 由 发 送 方 切换 人 至 接收 方 时 ， 如 宋 存 在 执 
行 优先 级 更 高 的 进程 ， 且 该 进程 也 使 用 了 块 设备 的 缓冲 区 时 ， 则 无 法 期 
待 缓冲 区 带 来 的 缓存 效果 。 此 时 ， 人 性 能 虽然 并 未 得 到 改善 ， 但 是 由 于 数 
据 已 输出 至 块 设备 ,因此 对 通信 内 容 本 号 不 会 造成 影响 。 














管道 基于 现 有 的 文件 系统 ， 实 现 的 成 本 较 低 。 尽 管 占用 的 资源 较 少 ， 却 
实现 了 进程 间 的 高 速 通信 。 低 投入 高 产 出 可 视 作 管道 最 大 的 魅力 。 








11.2. ”开始 管道 通信 
系统 调用 pipe 


系统 调用 pipe 用 来 建立 管道 通信 ，pipe() 为 其 处 理 函 数 《〈 代 码 清单 
11-3 ) 。 


首先 在 user.u_ofile[] 和 file[] 中 分 配 供 read 和 write 使 用 的 元 
素 ， 然 后 获取 根 磁盘 的 inode[ ] 元 素 ， 将 供 read 和 write 使 用 的 
file[] 元 素 指向 该 inode[] 元 素 。 为 file[] 元 素 设置 表示 管道 的 
FPIPE 标志 位 (图 11-2 ) 。 

























u.u. ofile[] file[] inodel] 


二 


count=1 


图 11-2 pipe() 


read 和 write 使 用 的 文件 描述 符 返 还 给 用 户 程序 。 用 户 程 序 对 竺 该 文 
件 描 述 符 ， 可 以 像 对 竺 一 般 文 件 一 样 进 行 读 写 ， 实 现 管道 通信 。 


代码 清单 11-3 pipe() (ken/pipe.c) 


1 pipe() 





2 { 

3 register *ip, *rf, *wf; 

4 int r; 

5 

6 ip = ialloc(rootdev); 

7 if(ip == NULL) 

8 return; 

9 rf = falloc(); 
10 if(rf == NULL) { 
11 iput(ip); 
12 return; 
13 } 
14 r = u.u are[Re]; 
15 wf = falloc(); 
16 if(wf == NULL) { 
17 rf->f_count = 6; 
18 u.u_ofile[r] = NULL; 
19 iput(ip); 
20 return; 
21 } 
22 u.u_arð[R1] = u.u are[Re]; 
23 u.u are[Re] = r; 
24 wf->f_flag = FWRITE|FPIPE; 
25 wf->f_inode = ip; 
26 rf->f_flag = FREAD|FPIPE; 
27 rf->f_inode = ip; 
28 ip->i_count = 2; 
29 ip-»i flag = IACC|IUPD; 
30 ip-»i mode - IALLOC; 

31 ) 





6-8 ”从 根 磁盘 的 inode[] 获取 新 的 元 素 。 


9~14 在 user.u ofile[] 和 file[] 中 分 配 供 read 使 用 的 元 
素 。falloc() 中 将 所 取得 user.u ofile[] 元 素 的 数组 下 标 〈 文 
人 


15-23 同样， 在 user.u_ofile[] 和 file[] 中 分 配 供 write 使 

用 的 元 素 。 用 户 进程 的 n1 中 保存 了 供 write 使 用 的 文件 描述 

由 S. RTR read 使 用 的 文件 描述 符 。 这 两 个 值 将 被 返回 给 
FR. 











24-30 ”对 取得 的 元 素 进 行 初始 化 。 为 供 read 使 用 的 file[] 元 素 
设置 FREAD、FPIPE 标志 位 ， 为 供 write 使 用 的 file[] 元 素 设置 
FWRITE、FPIPE 标志 位 。 无 论 是 read 还 是 write 使 用 的 file[] 
元 素 ， 都 使 其 指向 之 前 取得 的 根 磁 盘 的 inode[ ] 元 素 。 将 
inode[] 元 素 的 参照 计数 器 的 值 设 定 为 2， 并 设置 参照 标志 位 和 更 
新 标志 位 ， 最 后 将 inode.i mode 设置 为 ITALLOC。 





11.3 收发 数据 


对 通过 系统 调用 pipe 取得 的 文件 描述 符 ， 可 以 像 对 待 一般 文件 那样 执 
行 系统 调用 read 和 write， 从 而 实现 数据 收发 〈 代 码 清单 11-4 ) 。 


代码 清单 11-4. rdwr() 中 的 相关 代码 Cken/sys2.c) 


u.u base = u.u arg[0]; 
u.u count - u.u arg[1]; 
u.u segflg = 0; 
if(fp-»f flag&FPIPE) { 
if(m--FREAD) 
readp(fp); else 
writep(fp); 
) else ( 
u.u offset[1] 
u.u offset[0] 
if(m--FREAD) 
readi(fp-»f inode); else 
writei(fp-»f inode); 
dpadd(fp-»f offset, u.u arg[1]-u.u count); 


fp-»f offset[1]; 
fp-»f offset[0]; 


u.u are[Re] = u.u arg[1]-u.u count; 





16-19 当 设 置 了 file[] 元 素 的 FPIPE 标志 位 时 ， 在 rdwr() 中 
将 执行 writep() 和 readp(). 


writep() 


writep() 用 来 对 管道 进行 写 入 处 理 〈 表 11-1， 代 码 清单 11-5 ) 。 因 为 
管道 的 实体 为 文件 ， 所 以 采用 与 对 竺 一般 文 件 相同 的 方式 调用 
writei() 写 入 数据 。 当 管道 被 充满 〈4096 F) 时 进入 睡眠 状态 。 如 
条 存在 等 待 管道 被 写 入 数据 的 进程 ， 则 将 其 唤醒 。 


但 是 ， 与 一 般 文 件 处 理 不 同 ,文件 偏 移 量 (file.f_offset) 不 会 发 生 
变化 (图 11-3)。 











管道 ( 实体 为 文件 ) 


inode.i size —» RN 
file.f offset —» 


图 11-3 writep() 


K 11-1 writep() 的 参数 


file[] 元 素 





1 

2 

3 register *rp, *ip, c; 

4 

5 rp = fp; 

6 ip = rp-»f inode; 

7 C = Uu.u count; 

8 

9 loop: 

10 plock(ip); 

11 if(c == 0e) { 

12 prele(ip); 

13 u.u count - 0; 

14 return; 

15 } 

16 if(ip->i count < 2) { 

17 prele(ip); 

18 u.Uu error = EPIPE; 

19 psignal(u.u procp, SIGPIPE); 
20 return; 

21 } 

22 if(ip-»i size1 == PIPSIZ) { 
23 ip-»i mode =| IWRITE; 


24 prele(ip); 


25 sleep(ip*1, PPIPE); 


26 goto loop; 

27 

28 u.u offset[0] = ð; 

29 u.u offset[1] = ip-»i sizel; 
30 u.u count = min(c, PIPSIZ-u.u off set[1]); 
31 C =- Uu.U count; 

32 writei(ip); 

33 prele(ip); 

34 if(ip-»i mode&IREAD) { 

35 ip-»i mode =& -IREAD; 

36 wakeup(ip-*2); 

37 

38 goto loop; 

39 ) 





10 加 锁 0 inode[ ] 元 素 。 


11415 ” 当 数 据 输 出 完毕 后 为 inode[] 元 素 解锁 。 将 u.u_count 
清 0 并 返回 。 


16-21 如果 接 收 方 的 管道 被 关闭 ，inode[ ] 元 素 的 参照 计数 器 的 
值 将 小 于 2。 这 会 造成 数据 无 法 被 发 送 ， 因 此 进行 出 错 处 理 。 为 
inode[] 元 素 解 锁 ， 并 癌 自 身 发 送信 号。 


22-27 ”如 果 管 道 被 充满 ， 则 为 jnode[ ] 元 素 设 置 INRITE 标志 
位 ， 并 为 inode[] 元 素 解 锁 ， 然 后 进入 睡眠 状态 等 待 资源 ip+1。 
在 管道 处 理 中 ，IWRITE 标志 位 表示 管道 已 被 充满 ， 发 送 方正 在 等 
待 数据 被 使 用 。 在 被 接收 方 唤醒 之 后 ， 发 送 方 将 返回 1oop， 继 续 
向 管道 写 入 数据 。 

28-31 将 u.u_offset 设 定 为 当前 的 文件 长 度 ， 将 u.u_count i 
定 为 小 于 管道 容量 〈4096 FW) 的 值 。 局 部 变量 c 中 保存 着 准备 
写 入 的 数据 的 剩余 字 节 数 。 

32 执行 writei() 写 入 数据 。 

33 为 inode[ ] 元 素 解锁 。 


34-37 ”如 果 设 置 了 inode[] WRKY IREAD 标志 位 ， 则 将 其 清除 然 





后 唤醒 接收 方 的 进程 。 

38 返回 loop， 继 续 癌 管道 写 入 数据 的 处 理 。 
readp() 
readp() 从 管道 读 取 数据 ( 表 11-2， 代 码 清单 11-6 ) 。 因 为 管道 的 实 
体 为 文件 ， 所 以 采用 与 对 待 一 般 文件 相同 的 方式 调用 readi() 读 取 数 
据 。 当 管道 变 空 时 进入 睡眠 状态 。 如 果 存 在 因 管道 被 充满 而 等 待 其 他 读 
取 数 据 的 进程 ， 则 将 其 唤醒 。 


文件 偏 移 量 将 随 着 从 管道 中 读 取 的 数据 增 大 ， 妆 偏 移 量 与 文件 长 度 同 值 
时 ， 文 件 长 度 与 文件 指针 都 将 归 0 (图 11-4 ) 。 


inode.i size —» TN 


file.f offset —» 
4 








inode.i size 


file.f offset , 
4 


inode.i_size I 
file.f offset 


图 11-4 readp() 


表 11-2 readpO 的 参数 


参数 


nb» 
x 


file[] 元 素 





代码 清单 11-6 readp() (ken/pipe.c) 


1 readp(fp) 
2 int *fp; 
3 { 
4 register *rp, *ip; 
5 
6 rp = fp; 
7 ip rp->f_inode; 
8 
9 loop: 
10 plock(ip); 
11 if(rp-»f offset[1] == ip-»i size1) { 
12 if(rp-»f offset[1] !- 0) ( 
13 rp-»f offset[1] = ð; 
14 ip-»i size1 = 6; 
15 if(ip-»i mode&IWRITE) { 
16 ip-»i mode =& -IWRITE; 
17 wakeup(ip-1); 
18 } 
19 
20 prele(ip); 
21 if(ip-»i count « 2) 
22 return; 
23 ip-»i mode -| IREAD; 
24 sleep(ip*2, PPIPE); 
25 goto loop; 
26 } 
27 u.u offset[0] = ð; 
28 u.u offset[1] rp-»f offset[1]; 
29 readi(ip); 
30 rp-»f offset[1] = u.u offset[1]; 
31 prele(ip); 
32 ) 





10 加 锁 inode[] 元 素 。 


11 如 果 已 读 取 了 管道 中 的 全 部 数据 ， 则 进入 睡眠 状态 以 便 发 送 方 
传送 更 多 的 数据 。 


12 读 取 了 若干 数据 后 的 处 理 。 
13-14 ”对 已 读 取 的 数据 ， 将 文件 偏 移 量 和 文件 长 度 清 0。 


15-18 ”如 果 设 置 了 IWRITE 标志 位 ， 则 将 其 清 0， 唤 醒 发 送 方 的 进 
程 。 


20 解锁 inode[ ] 元 素 。 


21922 ” 当 友 送 方 的 进程 关闭 了 管道 时 ，inode[ ] 元 素 的 参照 计数 
器 的 值 将 小 于 2， 此 时 结束 管道 处 理 。 


23-25 ”为 inodef[ ] 元 素 设置 IREAD 标志 位 并 进入 睡眠 状态 。 在 管 
道 处 理 中 ，IREAD 标志 位 表示 管道 已 空 ， 数 据 的 接收 方正 在 等 待 更 
多 的 数据 。 当 接收 方 被 发 送 方 的 进程 唤醒 后 ， 将 返回 loop 继续 读 
取 处 理 。 

27-29 ” 设 定 偏 移 量 ， 然 后 执行 readi() 读 取 数据 。 

30” 当 数据 读 取 完毕 后 更 新 文件 偏 移 量 。 


31 解锁 inode[ ] 元 素 。 








plock() 

plock() 用 于 对 inode[] 元 素 进行 加 锁 处 理 〈 表 11-3， 代 码 清单 11-7 
) 。 该 函数 为 inode[ ] 元 素 设 置 TILOCK 标志 位 。 如 果 已 设置 了 该 标志 
位 ， 则 为 ijnode[ ] 元 素 设 置 IWANT 标志 位 并 进入 睡眠 状态 。 


表 11-3 plock() 的 参数 





代码 清单 11-7 plock() Cken/pipe.c) 


1 plock(ip) 


register *rp; 


rp - ip; 

while(rp-»i flag&ILOCK) { 
rp-»i flag =| IWANT; 
sleep(rp, PPIPE); 


} 
rp-»i flag -| ILOCK; 





prele() 

prele() 用 于 清除 inode[] 元 素 的 ILOCK 标志 位 并 为 其 解锁 《〈 表 11- 
4， 代 码 清单 11-80 。 当 设置 了 IWANT 标志 位 时 则 将 其 清除 ， 并 唤醒 其 
他 正在 等 待 该 inode[] 元 素 的 锁 被 释放 的 进程 。 


K 11-4 prele() 的 参数 








4 register *rp; 

5 

6 rp - ip; 

7 rp-»i flag =& -ILOCK; 

8 if(rp-»i flag&IWANT) { 

9 rp-»i flag -& -IWANT; 
10 wakeup(rp); 
11 } 


11.4 Z5 EEE 


closef() 


JR 道 通信 结束 后 ， 用 户 程 序 对 通过 系统 调用 pipe m me 
符 ， 像 对 竺 一 般 文 件 一 样 执行 系统 调用 close 来 关闭 管道 


如 果 设 置 了 filef[] 元 素 的 FPIPE 标志 位 ， 则 在 closef() 中 为 
file[] 元 素 指向 的 inode[] 元 素 清除 IREAD 和 IWRITE 标志 位 ， 并 唤 
醒 发 送 方 和 接收 方 的 进程 。 通 信 的 双方 此 时 都 处 于 睡眠 状态 ， 等 待 对 方 
进行 读 写 ， 如 果 对 方 的 进程 就 这 样 结束 处 理 ， 
醒 ， 因 此 要 在 此 处 进行 唤醒 处 理 〈 代 码 清单 11-9 ) 。 


此 后 的 处 理 流 程 与 关闭 一 般 文 件 相同 。 
代码 清单 11-9 closef() 的 相关 处 理 (ken/fio.c) 








if(rfp-»f flag&FPIPE) { 
ip = rfp-»f inode; 
ip-»i mode -& -(IREAD|IWRITE); 
wakeup(ip-1); 
wakeup(ip-*2); 


j 
if(rfp-»f count <= 1) 

closei(rfp-»f inode, rfp-»f flag&FWRITE); 
rfp-»f count--; 





11.5 ”建立 管道 通信 的 流程 
建立 父子 进程 间 的 通信 


本 节 介 绍 在 父子 进程 间 建 立 管 道 通 信 的 流程 ， 此 处 需要 用 到 系统 调用 
pipe、 系 统 调 用 fork 以 及 系统 调用 close。 


在 系统 调用 pipe 执行 结束 后 ， 再 执行 系统 调用 fork， 父 进程 的 
user.u_ofile[] 的 内 容 将 被 复制 到 新 生成 的 子 进程 中 。 如 果 利 用 系统 
调用 close 关闭 与 父 进 程 的 read 使 用 的 文件 描述 符 ， 和 与 子 进程 的 
write 使 用 的 文件 描述 符 相 对 应 的 user.u_ofile[] 元 素 ， 就 形成 了 一 
条 从 父 到 子 传送 数据 的 管道 (图 11-5 ) 。 


进程 1 


user.u_ofile[] file[] inodel[] 









4 系统 调用 fork 
进程 1 
user.u. ofile[] file[] inodel] 


A count-2 


进程 2 


user.u ofile[] 





i 系统 调用 close 
进程 1 
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图 11-5 pipe. fork. close 


再 加 上 系统 调用 dup， 就 可 以 实现 在 Shell 中 使 用 的 通过 “连接 的 管道 
通信 (代码 清单 11-10) 。 此 例 中 ，1s 向 标准 输出 写 入 数据 ， 而 cat 
从 标准 输入 中 取得 数据 ， 通 过 这 种 简单 的 方式 即 可 实现 数据 的 交换 。 


代码 清单 11-10 管道 通信 


1% 1s | cat 


进程 的 user.u_ oflie[0]. user.u oflie[1] 和 user.u oflie[2] 
中 分 别 保存 了 与 标准 输入 〈stdin) 、 标 准 输出 〈stdout ) 和 标准 错误 
输出 〈stderr) 相对 应 的 文件 描述 符 。 程序 在 对 标准 输入 、 标 准 输出 
dao 误 输 出 进行 读 写 时 ， 需 要 使 用 系统 调用 read M write, ER 
的 管道 通信 通过 将 标准 输入 和 标准 输出 改 为 管道 得 以 实现 。 


在 执行 系统 调用 pipe 和 fork 之 后 ， 通 过 系统 调用 close 关闭 父 进程 
的 标准 输出 〈=user.u_ofile[1] ) 和 子 进 程 的 标准 输入 

(=user.u_ofile[0]) 。 此 后 ， 执 行 系统 调用 dup 复制 与 write 和 
read 使 用 的 文件 描述 符 相 对 应 的 user.u ofile[] 元 素 。 因 为 系统 调 
用 dup 将 文件 描述 符 复 制 到 user.u zen 中 排 在 最 前 面 的 空闲 元 
素 处 ， 所 以 write 和 read 使 用 的 文件 描述 符 将 被 复制 到 刚才 关闭 的 
user.u_ofile[ ] 元 素 的 位 置 。 


最 后 ， 关闭 由 系统 调用 pipe 生成 的 与 write 和 read 使 用 的 文件 描述 
符 相 对 应 的 user.u_ofile[] 元 素 ， 结 束 建 立 管道 通信 的 处 理 〈 图 11- 
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* 系统 调用 close 


进程 1 


user.u. ofile[l filel[l inodell 





进程 2 





系统 调用 dup 
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+ 系统 调用 close 
进程 1 


user.u. ofile[] filell inodell 


进程 2 
user.u, ofile[] 


图 11-6 pipe. fork. close. dup. close 


系统 调用 dup 


dup() 为 系统 调用 dup 的 处 理 函 数 C 11-5， 代 码 清单 11-11 ) 。 系 统 
调用 dup 将 与 用 户 程 序 指定 的 文件 摘 述 符 相 对 应 的 user.u_ofile[] 
元 素 复 制 到 user.u_ofile[] 中 排 在 最 前 面 的 空闲 元 素 处 〈 图 11-7 

Joa 





user.u. ofile[] file[] 





user.u ofllel[] file[] 


复制 





图 11-7 系统 调用 dup 


表 11-5 系统 调用 dup 的 参数 




















register i, *fp; 


fp = getf(u.u are[Re]); 
if(fp -- NULL) 
return; 
if ((i = ufalloc()) < 0) 
return; 
u.u ofile[i] = fp; 
fp-»f counte-*; 








2a 取得 与 用 户 程序 通过 参数 指定 的 文件 描述 符 相 对 应 的 file] 
元 素 。 


8-9 取得 u.u_ofile[] 中 排 在 最 前 面 的 空闲 元 素 。 


10-11 将 获取 的 u.u_ofile[] 元 素 指 回 在 第 5 行 中 获取 的 file[] 
元 素 ， 并 递增 file[ ] 元 素 的 参照 计数 器 的 值 。 


11.6 ”小结 
。 利 用 管道 可 以 实现 父子 进程 间 的 通信 。 


。 发 送 方 进程 和 接收 方 进程 交 蔡 对 长 度 为 4096 字 节 的 管道 文件 ) 
进行 读 写 。 








e 结合 系统 调用 pipe、fork、close、dup， 建 立 管 道 通信 。 


第 VI 部 分 字符 IO 系统 

字符 VO 设备 以 文字 为 单位 处 理 数据 ,在 行 打印 机 和 终端 等 直接 被 用 户 使 
用 的 外 部 设备 中 经 常用 到 。 第 VI 部 分 主要 介绍 以 下 内 容 。 

。 宁 从 设备 如 何 与 系统 进行 数据 交换 

e 字符 设备 驱动 如 何 对 字符 设备 进行 操作 

e. 内 核 如 何 对 终端 处 理 提 供 支 持 

通过 阅读 本 部 分 的 内 容 ,读者 会 了 解 用 户 和 系统 是 如 何 发 生 关 联 的 。 





第 12 章 字符 设备 
12.1 字符 设备 驱动 


与 块 设备 驱动 相同 ， 字 符 设 备 也 存在 相应 的 设备 驱动 表 。cdevsw[ ] 为 
字符 设备 驱动 表 (代码 清单 2-1， 表 12-1 ) 。 


字符 设备 利用 缓冲 区 处 理 数据 (图 12-1 ) 。 


Sob 





cdevswl] 


图 12-1 字符 设备 驱动 表 


代码 清单 12-1 cdevsw[] (conf.h) 





truct cdevsw 


1s 
2 { 
3 int (*d_open)(); 
4 int (*d_close)(); 
5 int (*d_read)(); 
6 int (*d_write)(); 


7 


int 


8 } cdevsw[ ]; 


(*d sgtty)(); 





表 12-1 


核 进行 重新 构筑 。 


cdevsw 结构 体 


cdevsw[ ] 的 实体 与 bdevsw[ ] 相同 ， 由 conf.c 设置 (代码 清单 12-2 
) 。 系 统管 理 者 需要 根据 系统 所 使 用 的 字符 设备 编辑 conf.c， 并 对 内 


































































































j 于 打开 设备 的 函数 的 指针 


于 关闭 设备 的 函数 的 指针 


] 于 读 取 的 函数 的 指针 


] 于 写 入 的 函数 的 指针 


j 于 设 定 终端 的 函数 的 指针 





代码 清单 12-2 cdevsw[] 的 例子 (conf.c) 








1 
2 
3 
4 
5 
6 
7 
8 
9 


10 


“~ 


> 
e 


(*cdevsw[]) () 
&klopen, &klclose, 
&pcopen, &pcclose, 
&lpopen, &lpclose, 
&nodev, &nodev, 
&nodev, &nodev, 
&nodev, &nodev, 
&nodev, &nodev, 
&nodev, &nodev, 
&nulldev,  &nulldev, 
&nodev, &nodev, 


&nodev, 


&nodev, 


&klread, 
&pcread, 
&lpread, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&mmread, 
&rkread, 
&nodev, 


&klwrite, 
&pcwrite, 
&lpwrite, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&mmwrite, 
&rkwrite, 
&nodev, 


&klsgtty, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 
&nodev, 


/* 


14 &nodev, &nodev, &nodev, &nodev, &nodev, /* rp */ 


15 &nodev, &nodev, &noddev, &nodev, &nodev, /* tm */ 
16 &nodev, &nodev, &nodev, &nodev, &nodev, /* hs */ 
17 &nodev, &nodev, &nodev, &nodev, &nodev, /* hp */ 
18 &nodev, &nodev, &nodev, &nodev, &nodev, /* ht */ 





字符 设备 缓冲 区 


字符 设备 驱动 利用 缓冲 区 与 字符 设备 进行 数据 交换 。 绥 冲 区 的 实体 为 
cblock 结构 体 的 数组 cfree[] 〈 代 码 清单 12-3， 表 12-2 ) 。 


代码 清单 12-3 cblock (dmr/tty.c) 


1 struct cblock ( 

2 struct cblock *c next; 

3 char info[6]; 

4 jy 

5 struct cblock cfree[NCLIST]; 





表 12-2 cblock Z5 T4 


&x 





指向 下 一 个 cblock 结构 体 的 指针 





数据 。 长 度 为 6 字 节 《文字 ) 





绥 冲 区 由 链表 进行 管理 ，c_next 为 指向 下 一 个 cblock 结构 体 的 指 
针 ，info[] 用 于 容纳 数据 ， 每 个 cblock 结构 体 可 保存 长 度 为 6 字 节 
(文字 ) 的 数据 。 


每 个 字符 设备 驱动 都 拥有 以 clist 结构 体 〈 代 码 清单 12-4， 表 12-3 ) 
为 起 始 元 素 的 缓冲 区 的 链表 。 未 使 用 的 缓冲 区 由 cfreelist (代码 清单 


12-5 ) 指 同 的 以 cblock 结构 体 为 起 始 元 素 的 空闲 队列 进行 管理 。 设 备 
驱动 在 需要 时 从 空闲 队列 取得 cblock 结构 体 ， 并 在 使 用 完毕 后 返还 给 
空闲 队列 COE 12-225 。 


代码 清单 12-4 clist (tty.h) 

















代码 清单 12-5 cfreelist ( dmr/tty.c) 


1 struct cblock *cfreelist; 


缓冲 区 池 ( 空闲 队列 ) 


cfreelist 


释放 全 
n ANI ro m 
ài c m 2 | MJ d 
clist \ 
l I 
l I 
~ zd 


clist 


缓冲 区 的 分 配 





图 12-2 


对 缓冲 区 的 操作 
字符 设备 驱动 通过 由 汇编 语言 编写 的 getc() 和 putc() 操作 缓冲 区 。 


考虑 一 下 某 个 字符 设备 驱动 将 长 度 为 16 文字 (16 字 市 ) 的 字符 
串 “hellogoodbyehowa” 保 存在 缓冲 区 时 的 情况 〈 图 12-3 ) 。 


cblock cblock cbloc 


k 
} c_next 


info[6] 





dus 


Rm cblock cblock cblock 


TEE - 


图 12-3 ”缓冲 区 链表 的 例子 


getc() 从 缓冲 区 的 起 始 位 置 取得 一 个 文字 。 图 12-4 表示 从 绥 冲 区 的 起 
始 位 置 取出 文字 h 时 的 情况 。 


ps 回 绥 冲 区 的 末尾 退 加 一 个 文字 。 图 12-5 表示 在 图 12-4 的 基础 
上 向 缓冲 区 的 末尾 追加 文字 rz 时 的 情况 。 由 于 末尾 的 cblock ź AREH 
infor] 己 被 用 尽 ， 因 此 此 处 需要 从 空闲 队列 中 取得 新 的 cblock 结构 





PS 


ita cblock cblock cblock 


313 E 


图 12-4 getc() 





cfreelist 


De LL 
D Cblock cblock cblock 


图 12-5 putc() 
初始 化 缓冲 区 池 
cinit() 是 初始 化 缓冲 区 池 时 使 用 的 函数 〔( 代 码 清 单 12-6) . 


动 时 由 main() 调用 ， 且 仅 调用 一 次 。 


该 函数 将 cfree [ ] TER CS 


加 至 空 几 队列 ， 并 统计 系统 中 使 用 的 字符 设备 (的 种 类 〉 的 数量 ， 保 存 
统计 结果 。 


代码 清单 12-6 cinit() (dmr/tty.o) 


1 cinit() 
2í1 
3 register int ccp; 


4 register struct cblock *cp; 

5 register struct cdevsw *cdp; 

6 

7 ccp = cfree; 

8 for (cp=(ccp+07)&~07; cp <= &cfree[NCLIST-1]; cp++) ( 
9 cp-»c next = cfreelist; 
10 cfreelist = cp; 
11 } 
12 ccp = €; 
13 for(cdp = cdevsw; cdp->d open; cdp++) 
14 CCp++; 
15 nchrdev = ccp; 
16 } 





7-11 问 空 闲 队 列 追 加 cfree[] 的 元 素 ， SEPA UST E 照 

cfree[]。 由 于 构成 cfree[] 元 素 的 Nr ERKEN 8 F 
cun for 语句 中 的 初始 化 计算 公式 进行 调整 ， 使 起 始 地 址 为 
8 的 倍数 。 


12~15 ”通过 统计 在 cdevsw[ ] 中 注册 的 cdevsw.d open 处 理 函 数 
的 数量 ， APIS (驱动) 的 数量 ， 将 统计 结果 保存 在 
nchrdev 中 。 





1 此 处 将 空闲 队列 向 8 倍数 字 节 地 址 对 齐 ， 人 
到 8 倍数 字 厄 地 址 ， 则 可 以 判断 此 缓存 块 已 经 读 审 校 者 注 















































代码 清单 12-7 nchrdev (conf.h) 


1 int nchrdev; 


12.2 LP11 设备 驱动 
以 下 以 LP11 的 设备 驱动 为 例 介 绍 字 符 设 备 驱动 。 
什么 是 LP11 


LP11 是 由 DEC 公司 开发 的 与 PDP-11 系列 相对 应 的 行 打印 机 ， 用 于 打 
印 所 要 求 的 文字 。 


LP11 对 应 ASCII 码 。 根据 型 号 的 不 同 使 用 96 文字 或 64 SCOPI 
R, 64 文字 的 字符 集 称 为 half ASCI 字符 集 ， 只 支持 大 写 文字 和 部 分 符 
i 











当 输 入 表 12-4 所 示 的 ASCII 人 码 时 ， 并 不 打印 文字 而 是 进行 相应 的 处 
理 。 


表 12-4 LP11 可 处 理 的 特殊 文字 


换行 CLP) 


Æ (CR) 。 将 打印 头 移动 至 行 的 起 始 位 置 














LP11 拥 有 两 个 16 位 的 寄存 器 。 一 个 是 用 来 处 理 控制 信息 的 LP Status 寄 
ff CK 12-5 ) ， 男 一 个 是 用 来 处 理 输出 文字 的 LP Data Buffer 2; f£ 
( 表 12-6 ) 。 当 数据 存 入 LP Data Buffer 寄存 器 后 ， 会 启动 LP11 的 打 
印 处 理 ， 将 LP Status 寄存 器 的 第 7 比特 位 设 为 0。 当 打印 处 理 结束 后 ， 
LP Data Buffer 寄存 器 的 值 被 清空 ，LP Status 寄存 器 的 第 7 比特 位 则 会 

被 设 定 为 1。 


表 12-5 LP Status 寄存 器 


























里 过 程 中 发 生 错 误 时 设置 为 1 








表示 LP11 处 于 Ready 状态 。 当 LP Data Buffer 寄存 器 中 存在 数据 可 传递 给 LP11 
时 设 为 0。 当 LP11 的 处 理 结束 后 设置 为 1 
































设置 为 1 时 表示 LP11 的 处 理 结束 ， 或 是 发 生 了 错误 。 此 时 ， 通 过 中 断 优 先 级 4 
和 向 量 0200 引发 中 断 

















表 12-6 LP Data Buffer 寄存 器 
































打印 对 象 文 字 的 ASCI 码 。 当 设置 了 数据 之 后 ， 开 始 LP11 RUEDA 





数据 被 清 0 








LP11 设 备 驱 动 的 功能 
系统 管理 者 预先 生成 名 为 “/dev/lpn”(n 为 小 编号 ) 的 特殊 文件 。 
LP11 的 设备 驱动 主要 进行 下 述 处 理 (图 12-6 ) 。 


1. 当 程 序 发 出 输出 数据 的 请 求 时 ， 将 该 数据 退 加 至 缓冲 区 。 对 换行 和 制 
表 符 等 特殊 文字 进行 相应 的 处 理 。 


2. 将 LP11 无 法 输出 的 文字 更 改 为 可 输出 的 文字 。 


3. 将 缓冲 区 的 数据 传送 至 LP11 的 寄存 器 。LP11 的 寄存 器 被 写 入 数据 后 
将 引发 LP11 的 输出 处 理 。 


4. 如 果 发 生 了 LP11 的 处 理 终了 中 断 ， 则 继续 对 LP11 输出 数据 。 


换行 键 
BRIS (tab ) 
回 退 键 iue CID 


无 法 显示 的 文字 ”更改 LP11 





(4) 处 理 终了 中 断 


图 12-6 LP11 设备 驱动 

当 缩 进 功能 有 效 时 ， 在 行 的 起 始 位置 首 先 输出 长 度 为 8 文字 的 空白 。 
一 行 最 多 输出 80 文字 ， 超 过 的 文字 会 被 忽略 。 当 输出 一 定 行 数 之 后 将 
进行 换 页 处 理 。 

当 输 入 表 12-7 所 示 的 特殊 文字 时 ， 进 行 与 其 相对 应 的 处 理 。 


K 12-7 ASCII 码 的 特殊 文字 


特殊 码 
删除 此 前 的 1 个 文字 


输出 空白 ， 将 打印 头 移 至 以 8 文字 为 单位 时 的 下 一 个 位 置 





向 行 打印 机 输出 “FF” 换 行 
014 同行 打印 机 输出 “PF” 送 纸 


将 打印 头 移 至 行 的 起 始 位 置 。 当 缩 进 功能 有 效 时 输出 长 度 为 8 文字 的 空 











015 Ar) | Á 


对 使 用 half ASCI FRKA SS ANERER 
为 大 与 文字 ， 然 后 再 对 设备 进行 输出 处 理 。 此 外 ， 图 12-8 所 示 的 符 
号 ， 将 其 变 为 可 使 用 的 符号 并 登 加 表示 取消 的 文字 “-”。 


表 12-8 ”需要 更 改 的 符号 








LP11 设备 驱动 中 定义 了 名 为 1p11 的 结构 体 〈 代 码 清单 12-8， 表 12- 
9) 。 该 结构 体位 于 LP11 设备 驱动 使 用 的 缓冲 区 的 头 部 ， 也 用 于 管理 
LP11 的 状态 信息 和 打印 头 的 位 置信 息 。 


代码 清单 12-8 lp11 (dmr/lp.c) 


1 struct { 

2 int cc; 

3 int cf; 

4 int cl; 

5 int flag; 
6 int mcc; 
7 int ccc; 
8 int mlc; 


9 ) 1p11; 
10 

11 ttdefine 
12 ttdefine 
13 ttdefine 
14 ttdefine 





表 12-9 ”lp11 结构 体 














冲 区 中 的 文字 总 数 。 用 于 putc() 和 getc() 中 














冲 区 链表 的 尾部 。 用 于 putc() 和 getc() 中 


状态 、 控 制 信息 。 在 打开 设备 时 根据 LP11 的 型 号 和 模式 进行 相应 的 设 定 〈 参 
见 表 12-10) 


当前 处 理 行 中 打印 头 的 物理 位 置 





当前 处 理 行 中 打印 头 的 逻辑 位 置 


mlc | 页 中 的 处 理 行 数 


K 12-10 ”lp11 中 的 标志 位 


”| USE SEET (half ASCI RHOD 





























fs FH AXE TI RE 





输出 文字 后 ， 递 增 lp11.mcc 和 lp11.ccc 的 值 记 录 打 印 头 在 当前 行 中 
的 位 置 。 当 需要 输出 空格 或 因为 缩 进 需要 输出 空白 时 ， 并 不 是 每 次 都 将 
其 输出 至 打印 机 ， 而 是 只 递增 1p11.ccc 的 值 。 当 需要 输出 空白 以 外 的 
文字 时 ， 首 先 输出 长 度 为 1p11.mcc 5 lpii.ccc 差 值 的 空白 ， 再 输出 
该 文字 。 此 处 ， 将 lpii.mcc 称 为 “打印 头 的 物理 位 置 ?， 将 1p11.ccc 
称 为 “打印 头 的 逻辑 位 置 ”。 


lpopen() 


lpopen() 用 于 打开 LP11 的 处 理 〈 表 12-11， 代 码 清单 12-9 . XJ 
LP11 的 特殊 文件 执行 系统 调用 open 后 ， 在 open 的 处 理 函 数 调用 的 
openi() 中 执行 在 cdevsw[].d open() 中 注册 的 1popen(). 





lpopen() 首先 检查 设备 是 否 已 被 打开 ， 以 及 是 否 处 于 出 错 状 态 。 然 后 
WE lp11.flag 并 将 LP Status 寄存 器 的 第 6 比特 位 设 为 1。 最 后 让 
LP11 进行 送 纸 的 操作 。 


表 12-11 lpopen() 的 参数 


- [s | 

















Æ 1popen() 中 未 使 用 
dig 


代码 清单 12-9 lpopen( (dmr/lp.c) 











1 lpopen(dev, flag) 

2 { 

3 

4 if(lp11.flag & OPEN || LPADDR->lpsr < 0) ( 
5 u.u error - EIO; 

6 return; 

7 } 

8 lp11.flag =| (IND|EJECT|OPEN); 

9 LPADDR->lpsr =| IENABLE; 
10 lpcanon(FORM); 


11 } 


4~7 如果 LP11 已 打开 ,或 是 处 于 出 错 状态 ， 将 错误 代码 赋予 
u.u error 并 返回 。LP Status 寄存 器 的 第 15 比特 位 为 错误 标志 
位 ， 当 此 标志 位 被 设置 为 1 时 ，signed int 型 的 变量 为 负 值 。 


LPADDR 表示 LP11 寄存 器 映射 的 地 址 。1psr 为 用 于 操作 LP11 寄存 器 
的 结构 体 的 成 员 变 量 〈 代 码 清单 12-10 ) 。 


代码 清单 12-10 LPADDR (dmr/ken.c) 


1 #define LPADDR 0177514 
2 

3 struct ( 

4 int lpsr; 

int lpbuf; 


5 
6 }; 





8~10 XÍ LP11 进行 初始 化 处 理 。 首 先 设 定 lp11.flag 和 LP 
Status 寄存 器 ， 然 后 让 LP11 进行 送 纸 操 作 ， 再 重 置 打印 头 的 位 
Ho FORM 表示 ASCI 码 中 的 送 纸 字 符 (FF) (代码 清单 12- 
11) 。 


代码 清单 12-11 FORM (dmr/lp.c) 


1 #define FORM 014 


Ipwrite() 


lpwrite() 使 LP11 打印 字符 串 《〈 代 码 清单 12-12 ) 。 对 LP11 的 特殊 
文件 执行 系统 调用 write Ji, TE write 的 处 理 函 数 调用 的 writei() 
中 将 执行 在 cdevsw[].d write() 中 注册 的 1pwrite(). 


执行 cpass()， 从 用 户 空间 读 取 1 字 节 的 数据 ， 调 用 lpcanon() 使 
LP11 输出 该 数据 。 重 复 此 过 程 直至 所 有 数据 都 被 输出 。 








代码 清单 12-12 Ipwrite() (dmr/lp.c) 


lpwrite() 
{ 
register int c; 


while ((c2cpass())»-0) 
lpcanon(c); 


1 
2 
3 
4 
5 
6 
7 


} 





Ipcanon() 


lpcanon() 执行 与 参数 指定 的 长 度 为 1 字 节 的 文字 相对 应 的 处 理 〈 表 
12-12， 代 码 清单 12-13 ) 。 如 果 为 一 般 文 字 ， 则 执行 lpoutput() 使 
LP11 打印 该 文字 。 如 果 为 特殊 文字 ， 则 进行 与 其 对 应 的 处 理 。 


K 12-12 Ipcanon() 的 参数 


准备 输出 的 ASCI 码 


代码 清单 12-13 lpcanon() (dmr/lp.c) 





























1 lpcanon(c) 

2 { 

3 register c1, c2; 

4 

5 c1 = C; 

6 if(lp11.flag&CAP) { 

7 if(c1>='a' && c1<='z') 
8 c1 =+ 'A'-'a'; else 
9 switch(c1) { 

10 

11 case '(': 

12 c2-2 '('5 

13 goto esc; 

14 


15 case '}': 


16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 


lpcanon(c2); 
lpi11.ccc--; 


switch(c1) ( 


lpii.ccc = (lpi11.ccc«8) & -7; 


case FORM: 
case 'An': 
if((lp11.flag&EJECT) == 6 || 
lpii.mcc!-0 || lpi1.mlc!-0) ( 
lpi11.mcc = 6; 
lp11.mlc++; 
if(lp11.mlc >= EJLINE && lp11.flag&EJECT) 
c1 = FORM; 
lpoutput(c1); 
if(c1 == FORM) 
lpi11.mlc = 6; 


case 'Ar': 
lp11.ccc = 6; 
if(lp11.flag&IND) 
lp11.ccc = 8; 
return; 


case 010: 


63 if(lpi11.ccc > 0) 


64 lp11.ccc--; 

65 return; 

66 

67 case ' ' 

68 lp11.ccc++; 

69 return; 

70 

71 default: 

72 if(lp11.ccc < lp11.mcc) { 
73 lpoutput('\r'); 

74 lp11.mcc = 6; 

75 

76 if(lp11.ccc < MAXCOL) { 
77 while(lp11.ccc > lp11.mcc) { 
78 lpoutput(' '); 
79 lp11.mcce-; 

80 } 

81 lpoutput(c1); 

82 lp11.mcc++; 

83 } 

84 lp11.ccc++; 

85 } 

86 } 





6~35 ”使 用 half ASCI 码 字符 集 时 的 处 理 。 如 果 是 小 写 文 字 ， 则 将 





其 变 为 大 写 文 字 。 如 果 是 “{” 等 特殊 文字 ， 将 其 变 为 可 输出 的 文子 
后 ， 将 cl 设 定 为 表示 取消 的 文子 “-”， 然 后 继续 输出 其 他 文字 。 


39~41 XHAR Ot) 的 处 理 。 调 整 1p11.ccc 使 其 成 为 8 的 倍 
数 。 


43-54 ”对 送 纸 和 换行 符 (\n) 的 处 理 。 如 果 打 印 机 没有 排 纸 功 
能 ， 或 当前 页 上 已 有 打印 的 文字 ， 则 将 1p11.mcc 设 为 0 并 递增 
1p11.mlc 的 值 。 如 果 每 页 可 打印 的 行 数 较 多 代码 清单 12- 

14) ， 且 打印 机 具有 排 纸 功能 ， 则 进行 送 纸 ， 否 则 的 话 ， 则 输出 原 
有 的 送 纸 或 换行 符 。 送 纸 后 ， 将 表示 行 数 的 变量 1p11.mlc 清 0。 


代码 清单 12-14 EJLINE (dmr/lp.c) 


1 #define EJLINE 60 


56-60 ”对 回 车 符 (\r) 的 处 理 。 将 lp11.ccc 设 为 0。 如 果 设 置 
了 缩 进 标志 位 ， 则 将 1p11.ccc 设 定 为 8。 


62~65 对 Back Space 的 处 理 。 如 果 1p11.ccc 的 值 大 于 等 于 1， 

则 递减 该 值 。 

67-69 ”对 空白 的 处 理 。 递 增 1p11.ccc 的 值 。 

71-83 ”如 果 是 一 般 文 字 ， 则 进行 输出 。 当 lp11.ccc 小 于 
lpii.mcc 时 进行 回 车 处 理 。 如 果 1p11.ccc 小 于 MAXCOL 〈 每 行 可 
输出 的 最 大 文字 数 。 代 码 清单 12-150 ， 那 么 在 输出 文字 后 ， 北 增 


lpii.mcc 的 值 。 如 果 1p11.ccc KF 1p11.mcc 时 ， 输 出 长 度 为 
lp11.ccc 与 1p11.mcc 差 值 的 空白 ， 调 整 打印 头 的 物理 位 置 。 


代码 清单 12-15 MAXCOL (dmr/lp.c) 

1 #define MAXCOL 80 

84 递增 lp11.ccc 的 值 。 虽 然 无 需 打 印 ， 但 也 需 调 整 打印 头 的 逻 

辑 位 置 。 
Ipoutput() 
lpoutput() 使 LP11 打印 1 个 文字 ( 表 12-13， 代 码 清单 12-17 . Vil 
用 putc() 回 绥 冲 区 传送 数据 后 ， 执 行 lpstart() 启动 LP11 的 处 理 。 
但 是 ， 当 缓冲 区 内 的 数据 (等 待 输出 的 字符 串 〉 较 长 时 (LPHWAT 大 于 
等 于 100 ) ， 为 了 避免 出 现 缓冲 区 池 容 量 不 足 的 情况 ， 进 程 进入 睡眠 状 
态 。 随 着 使 用 缓冲 区 内 的 数据 (LPLWAT=50 ) ， 进 程 通过 lpint() 被 
唤醒 (代码 清单 12-16 ) 。 
代码 清单 12-16 LPLWAT 5 LPHWAT (dmr/lp.c) 

1 #define LPLWAT 50 


2 itdefine LPHWAT 100 


K 12-13 lpoutput() 的 参数 




















准备 输出 的 ASCII 码 


代码 清单 12-17 lpoutout() ( dmr/lp.c) 


poutput(c) 


if (lp11.cc >= LPHWAT) 
sleep(&lp11, LPPRI); 
putc(c, &1p11); 


spl4(); 
lpstart(); 
sp10(); 





344 如 果 绥 冲 区 内 的 数据 长 度 大 于 等 于 LPHNAT (1000 个 文字 ， 
则 进入 睡眠 状态 直至 数据 被 使 用 。 


5 执行 putc()， 向 缓冲 区 奶 加 1 字 节 的 数据 。 


6 将 处 理 器 优先 级 提升 至 4， 以 防止 在 LP11 的 输出 过 程 中 发 生 由 
LP11 引发 的 中 断 。 


7 执行 1pstart() 启动 LP11 的 输出 处 理 。 
8 当 LP11 的 处 理 结束 后 ， 将 处 理 器 优先 级 重 置 为 0。 





lpstart() 


lpstart() 用 于 启动 LP11 的 处 理 〈 代 码 清单 12-18 ) 。 如 果 LP11 处 
于 等 待 输入 的 状态 ， 且 缓冲 区 内 存在 数据 时 ， 从 绥 冲 区 取出 长 度 为 1 字 
节 的 数据 ， 将 其 赋予 LP Data Buffer 寄存 器 。 该 寄存 器 被 设 定数 据 后 ， 
LP11 将 自动 进行 输出 文字 的 处 理 。 


代码 清单 12-18 lpstart() ( dmr/lp.c) 


1 lpstart() 

2 

3 register int c; 

4 

5 while (LPADDR-»1psr&DONE && (c = getc(&lp11)) >= 0) 
6 LPADDR-»lpbuf = c; 

7 } 





lpint() 


LP11 在 结束 输出 文字 的 处 理 后 将 引发 中 断 ，lpint() 为 该 中 断 的 处 理 
函数 《代码 清单 12-19 . 

执行 1pstart()， 如 果 组 冲 区 内 存在 残留 数据 则 继续 印刷 处 理 。 当 缓冲 
区 内 的 数据 数量 (等 待 输 出 的 字符 串 数 ) 为 0 或 LPLNAT (=50 HJ, 
唤醒 因 等 待 数据 输出 而 进入 睡眠 状态 的 进程 。 


代码 清单 12-19 lpint0 ( dmr/lp.c) 


register int c; 


lpstart(); 
if (lp11.cc == LPLWAT || lp1ll.cc == 0) 
wakeup(&1p11); 





Ipclose() 


lpclose() 用 于 关闭 LP11〔 代 码 清单 12-200 . XT LP11 的 特殊 文件 执 
行 系统 调用 close 后 ， 将 在 close 的 处 理 函 数 调用 的 closei() 中 执 
行 在 cdevsw[].d close() 中 注册 的 1pclose()。1Lpclose() 使 LP11 
进行 送 纸 处 理 ， 并 将 lp11.flag 清 0。 


K 12-14 Ipclose() 的 参数 


参数 


n» 
xX 








dev 1E lpclose() 中 未 使 用 











dicii a 


代码 清单 12-20 Ipclose() (dmr/lp.c) 


pclose(dev, flag) 


lpcanon(FORM); 


lpii1.flag = 0; 





12.3 小结 
e 字符 设备 驱动 表 为 cdevsw[ ] 。 


。 字符 设备 驱动 以 字 节 为 单位 问 缓冲 区 传送 数据 ， 然 后 再 通过 缓冲 区 
将 数据 传送 给 设备 。 


"B 13 2€. 电 传 终端 


13.1 什么 是 电 传 终端 


电 传 终端 是 用 于 在 相 离 的 两 点 间 进 行 通信 的 输入 输出 装置 。UNIX V6 
内 核 支 持 电 传 终端 的 处 理 ， 用 户 通过 电 传 终端 可 以 以 对 话 的 形式 操作 系 
Zt. PDP-11 系列 附带 了 由 Teletype 公司 制造 的 ASR-33 型 电 传 终 端 (图 
13-12 。 








图 片 : Marcin Wichary, GFDL 


图 13-1 ASR-331 


| lhttp://ja.wikipedia.org/wiki/ASR-33 


电 传 终端 由 输入 装置 和 输出 装置 组 成 。 如 果 将 输入 装置 看 作 古 现在 的 键 
盘 ， 输 出 装置 看 作 显 示 器 (或 打印 机 〉 的 话 ， 应 该 更 容易 理解 。 


电 传 终端 采用 ASCH 码 。 输 入 数据 以 行为 单位 进行 处 理 。 如 果 只 是 输入 
字符 串 ， 那 么 输入 的 数据 只 会 保存 在 缓冲 区 内 ， 不 会 被 传送 到 系统 〈 用 
户 空 间 ) 。 只 有 当 输 入 换行 后 ， 绥 冲 区 内 的 数据 才 会 传送 到 系统 。 


电 传 终端 的 接口 


在 连接 PDP11/40 与 电 传 终端 时 ， 需 要 使 用 电 传 终端 接口 。 该 接口 与 
Unibus 并 行 通信 ， 与 电 传 终端 进行 串 行 通信 (图 13-2 ) 。 


ASR-33 等 


电 传 终端 接口 


Unibus 





并 行 通信 


图 13-2 电 传 终端 接 # 


电 传 终端 接口 有 KL11. DC11. DH11 等 多 个 种 类 。 设 备 驱 动 通 过 操作 
接口 拥有 的 寄存 器 控制 终端 。 根 据 接口 种 类 的 不 同 ， 其 规格 也 有 所 不 
同 ， 需 要 分 别提 供 相应 的 设备 驱动 。 与 接口 种 类 的 差异 无 关 的 共用 处 理 
定义 在 名 为 tty.c 的 文件 中 。 


为 了 运行 系统 操作 台 Cconsole ， 必 须 将 1 台电 传 终端 与 KL11 相连 。 
此 外 ， 也 可 让 系统 连接 多 个 接口 与 终端 ， 使 多 名 用 户 可 以 同时 使 用 系统 
CE] 13-3 ) 。 











必须 连接 1 个 系统 操作 台 用 户 终端 0~N 台 
图 13-3 多 人 台 终 端 
特殊 文件 


系统 管理 员 需 要 生成 名 为 /dev/ttyX(X 为 任意 文字 ) 的 特殊 文件 。 此 
外 ， 各 个 终端 的 设 定数 据 保存 在 名 为 /etc/ttys 的 文件 中 。 


系统 启动 时 ， 生 成 与 各 终端 相对 应 的 进程 ， 并 等 竺 用 户 的 连接 与 登录 。 
此 时 确定 了 标准 输入 (user.u_ofile[6]) 、 标 准 输 出 
Cuser.u_ofile[1]) 和 标准 错误 输出 (ser.u ofile[2]) 与 各 终 
问 的 对 应 关系 “〈 严 格 来 讲 ， 标 准 错误 输出 在 用 户 登 录 时 才 被 打开 ) 。 
tty 结构 体 


终端 拥有 属于 自己 的 tty 结构 体 〈 代 码 清单 13-1， 表 13-1 ) o tty 结 
构 体 管理 终端 的 设 定 和 控制 信息 ， 可 以 以 终端 为 单位 进行 设 定 。 

终端 的 tty 结构 体 与 proc.p ttyp 相关 联 ,进程 可 以 以 此 管理 负责 控 
制 自己 运行 的 终端 。 比 如 ， 通 过 此 处 的 关联 信息 ， 终 端 可 对 自己 控制 的 
所 有 进程 发 送信 和 号。 

代码 清单 13-1 tty 结构 体 〈tty.b) 


1 struct tty 
2 { 











i: 00-0 上 


10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 





struct clist t rawq; 

struct clist t canq; 

struct clist t outq; 

int t flags; 

int *t addr; 

char t delct; 

char t col; 

char t erase; 

char t kill; 

char t state; 

char t char; 

int t speeds; 

int t dev; 
n 
/* modes */ 
define HUPCL 01 
#define XTABS 02 
#define LCASE 04 
#define ECHO 010 
#define CRMOD 020 
define RAW 040 
itdefine ODDP 0100 
#define EVENP 0200 
#define NLDELAY 001400 


ttdefine TBDELAY 006000 
ttdefine CRDELAY 030000 
ttdefine VTDELAY 040000 


/* Internal state bits */ 
#define TIMEOUT 01 


#define WOPEN 02 
#define ISOPEN 04 
#define SSTART 010 
#define CARR_ON 020 
#define BUSY 040 
#define ASLEEP 0100 
}; 


表 13-1 tty 结构 体 




















t_rawq ”| 队列 。 用 于 管理 从 终端 输入 的 数据 























管理 由 输入 数据 经 过 适当 更 改 后 的 数据 

















管理 回 终端 输出 的 数据 




















*t_addr 端 接口 寄存 器 的 基地 址 


t rawq 中 分 隔 符 的 计数 器 


终端 打印 头 的 水 平方 向 的 位 置 。 用 于 计算 输 # 





























被 删除 的 1 个 文字 。 将 作为 系统 调用 stty 和 gtty 的 操作 对 



































删除 的 1 行文 字 。 将 作为 系统 调用 stty 和 gtty 的 操作 对 象 


m nm 


t char 临时 区 域 

















] stty 和 gtty 的 操作 对 象 






































HUPCL 关闭 处 理 时 切断 连接 





XTABS 模式 。 输 出 “%t" 时 ， 使 打印 头 输出 空白 直至 己 输 
(包括 空白 ) 为 8 字 节 的 倍数 。 并 非 让 终端 直接 处 理 制 是 在 设 
备 驱 动 端 模拟 再 现 制 表 符 















































里 大 写 文 字 








CR 模式 。 将 输入 的 CR( 回 车 : 将 打印 头 移 至 行头 ) 变 为 LE Gk 
行 ) 。 将 输出 的 LE 变 为 CR 和 LF 




















RAW 模式 。 不 进行 删除 1 文字 、 删 除 1 行 ， 或 通过 “进行 的 转 义 
(escape) 处 理 ， 将 输入 的 字符 串 直 接 传递 给 系统 



























































对 应 表示 NL 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 中 选择 


dn TAB 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 中 选 


对 应 表示 CR 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 中 选择 


对 应 表示 VT 延迟 时 间 的 比特 位 。 通 过 系统 调用 stty 从 多 个 类 型 中 选择 


K 13-3 tty 状态 的 标志 位 


















































TIMEOUT “| 输出 延迟 处 理 中 


ems [un —9 
c — 
ui addr 设 定 特殊 的 局 动 处 理 。 只 被 一 部 分 








Saa Tuns HER toma M 























tty 结构 体 拥有 3 个 缓冲 区 队列 (缓冲 区 链表 ) 。 从 终端 输入 的 数据 
由 队列 tty.t rawq 管理 ， 对 输入 数据 进行 适当 变化 后 的 数据 由 
tty.t canq 管理 ， 而 输出 数据 由 队列 tty.t outq 管理 (图 13-4 ) 。 


输出 装置 





输入 装置 


图 13-4 3 个 缓冲 区 


如 前 所 述 ， 从 终端 输入 的 数据 以 行为 单位 进行 处 理 。 如 果 输 入 了 换行 
^j, tty.t rawq 中 将 追加 工 个 与 其 对 应 的 分 隔 符 (=0377 

) 。tty.t_rawdq 中 分 隅 符 的 数量 ， 即 处 理 单位 的 数量 ， 由 

tty.t delct 管理 。 


终端 对 (由 缓冲 区 队列 保持 的 ， 未 向 系统 传送 的 ) 输入 的 字符 串 ， 可 以 
删除 其 中 的 1 个 文字 或 1 行文 字 ， 也 可 以 对 每 台 终 曾 分 别 设 定 在 输入 何 


种 文字 时 进行 上 述 删 除 处 理 。tty 结构 体 的 tty.t_erase 与 l 
tty.t_kill 对 应 上 述 设 定 ， 在 缺 省 状态 下 输入 “#” 时 删除 1 个 文字 ， 输 
入 “@” 时 删除 1 行文 字 。 


用 户 程序 通过 同 终 端的 特殊 文件 执行 系统 调用 stty 和 gtty 设 定 终 
端 。 但 是 ， 可 设 定 的 值 仅 限 于 tty 结构 体 的 
tty.t erase. tty.t kill. tty.t speeds 和 tty.t flags. 


根据 终端 的 不 同 ， 在 对 特殊 文字 进行 处 理 时 有 可 能 发 生 额 外 的 延迟 。 适 
当 设 定 tty.t_flags 可 使 终端 共用 处 理 进 行 适当 的 延迟 等 待 处 理 。 


此 外 ， 根 据 所 使 用 的 终端 ， 可 使 用 的 ASCI 代码 有 可 能 受到 限制 。 当 终 
端 只 能 处 理 大 写 文字 时 ， 从 终端 输入 的 大 写 文字 将 变 为 小 写 文字 ， 问 终 
端 输出 的 文字 则 变 成 大 写 文 字 。 因 此 ， 终 端 和 系统 内 部 所 处 理 的 文字 类 
型 分 别 统一 至 大 写 文 字 和 小 写 文字 。 另 外 ， 当 ASCII 码 受 到 限制 时 ， 终 
写 的 组 合 。 


413-4 发 生变 化 的 符号 











对 表 13-5 所 示 的 ASCII 码 进行 输入 输出 时 ， 将 在 系统 内 或 终端 内 进行 
特殊 的 处 理 。 


K 13-5 ASCH 码 特殊 文字 























INIT 
OIC 
p ee ee 
ONICRKNNN NN 
e peee p 
EN 
E m 


maptab[] 


终端 采用 ASCI 字符 集 。 若 干 ASCII 码 用 于 控制 终端 。 如 果 和 希望 按 照 
一 般 文字 进行 处 理 ， 需要 在 ; 之 前 加 入 反 和 斜 线 ”进行 转 义 。 这 些 文字 
(ASCII fij) 由 maptab[] 管理 (代码 清单 13-2 ) 。 


在 代码 清单 13-2 所 示 的 例子 中 ，【〔 缺 省 情况 下 〉 输 入 人 #” 将 删除 一 个 文 
字 ， 但 输入 “后 将 传送 “#* 本 丑 。 “HJ ASCI 码 为 043， 将 
maptab[043] 设 定 为 “#”。 




















此 外 ， 本 例 中 在 反 斜 线 之 后 输入 小 写 文字 时 ， 该 文字 将 变 为 相应 的 大 写 
Ms 


代码 清单 13-2 maptab[] Cdmr'tty.c) 


har maptab[] 


c 0 


000 ,000 ,000,000,004,000,000,000, 
000 ,000 ,000,000,000,000,000,000, 
000 ,000 ,000,000,000,000,000,000, 
000 ,000 ,000,000,000,000,000,000, 
000,'|',000, '#', 000,000,000, ^ ', 
'(',')',000,000,000,000,000,000, 
000 ,000 ,000,000,000,000,000,000, 
000 ,000 ,000,000,000,000,000,000, 
'Q' ,000,000,000,000,000,000,000, 
000 ,000 ,000,000,000,000,000,000, 
000,000 ,000,000,000,000,000,000, 
000,000 ,000,000,000,000, '.' , 000, 


co-Jopo| ui» uM.€H 


"uw cS s DU y M TW 
'X','Y','Z2',000,000,000,000,000, 





partab[] 


电 传 终端 使 用 8 比特 的 ASCH 码 传送 数据 ， 其 中 7 比特 为 ASCII 码 ， 

第 8 比特 位 为 偶 校 验 位 。 设 定 校 验 位 时 需要 使 用 partab[] 〈 代 码 清 单 
13-3， 表 13-6 ) 。 与 maptab[] 相同 ， 与 某 个 ASCII 码 n 所 代表 的 文字 
相对 应 的 partab[] 元 素 为 partab[n]。 


partab[] 个 仅 表 示 校 验 位 ， 也 表示 各 个 文字 ASCH W) 将 引发 何 种 
操作 。 在 输出 字符 串 时 ， 将 使 用 此 信息 来 判断 是 否 需要 延迟 输出 。 


代码 清单 13-3 partab[] (dmr/partab.c) 











1 char partab[] { 

2 0001,0201,0201,0001,0201,0001,0001,0201, 
3 0202,0004,0003,0205,0005,0206,0201,0001, 
4 0201,0001,0001,0201,0001,0201,0201,0001, 


5 0001,0201,0201,0001,0201,0001,0001,0201, 
6 0200, 0000 , 00000200, 0000, 0200,0200,0000, 
7 0000, 0200 ,0200,0000,0200,0000,0000,0200, 
8 0000, 0200 ,0200,0000,0200,0000,0000,0200, 
9 0200, 0000 ,0000,0200,0000,0200,0200,0000, 

10 0200, 0000 , 0000 , 0200, 0000, 0200, 0200, 0009, 

11 0000, 0200 , 0200 ,0000,0200,0000,0000,0200, 

12 00090, 0200 ,0200,0000,0200,0000,0000,0200, 

13 0200, 0009 , 0000 ,0200,0000,0200,0200,0000, 

14 0000, 0200 , 0200 ,0000,0200,0000,0000,0200, 

15 0200, 0009 , 0000 , 0200, 0000 , 02090,0200, 0009, 

16 0200, 0009 , 0000 ,0200,0000,0200,0200,0000, 

17 00900, 0200 ,0200,0000,0200,0000,0000,0201 














KL11/DL11 


与 终端 相关 的 代码 分 为 两 类 : 终端 共用 处 理 和 各 终端 接口 专用 的 设备 驱 
动 。 虽 然 终 端 处 理 的 大 部 分 都 集中 在 终端 共用 处 理 ， 但 由 于 处 理 的 流程 
涉及 上 述 两 类 代码 ， 因 此 下 文 将 对 两 者 进行 同时 介绍 。 下 面 将 以 
KL11/DL11 的 设备 驱动 为 例 ， 介 绍 终端 接口 的 设备 驱动 。 


KL11/DL11 拥有 4 个 16 比特 的 寄存 器 。 对 终端 的 输入 和 同 终 端的 输出 
分 别 具 有 属于 自己 的 控制 寄存 器 和 数据 寄存 器 ( 表 13-7 ) 。 


TM KLILUDL11 具有 1 个 端口 ， 可 以 连接 1 台 终 端 。 系 统 也 可 以 连接 








多 个 KL11/DL11 接口 。 


表 13-7 KL11/DL11 的 寄存 器 


HORA PAD ARI) 
HOMO RE CB RR 13.9) 
HORE SARIA 


K 13-8 klrcsr 


接收 处 理 〈 将 数据 传送 至 krbuf) 结束 时 设置 为 1 
an 当 第 7 比特 位 设置 为 1 时 中 断 优 先 级 4， 向 量 060 e| rH E 


















































接收 许可 。 此 比特 变 为 1 时 将 第 7 比特 位 清 








表 13-9 klrbuf 


比特 位 








比特 位 








终端 接口 已 做 好 接受 请 求 的 准 


a 当 第 7 比特 位 设 为 1 时 中 断 优先 级 4， 疝 量 064 将 引发 中 断 
用 于 维护 。 本 书 不 做 详细 说 明 


表 13-11  kltbuf 


由 7 比特 ASCI 码 和 头 部 的 偶 校 验 位 所 构成 的 8 比特 ASCH 码 






































KL11/DL11 设 备 驱 动 的 规格 


各 终端 被 赋予 一 系列 的 小 编号， 各 接口 的 寄存 器 被 映射 到 如 代码 清单 
13-4 和 图 13-5 所 示 的 内 核 空间 的 高 位 地 址 。 


代码 清单 13-4 KL/DLI11 的 基地 址 (dmxr/kl.o) 


1 #define KLADDR 0177560 
2 itdefine KLBASE 0176500 


3 #define DLBASE 0175610 





内 核 空 间 高 位 地 址 


DLBASE NKL11 ~ ，DL11 连 接 的 终端 
KLBASE 1~ NKL11-1: KL11 连 接 的 终端 
KLADDR I 0， 系 统 操 作 台 (console ) 
0177560 


图 13-5 KL11/DL11 地 址 


与 KL11 连接 的 供 系统 操作 台 使 用 的 终端 ， 对 应 的 寄存 器 的 基地 址 被 映 
射 至 KLADDR (01775600 ， 与 KL11 连接 的 其 他 终端 相对 应 的 寄存 器 被 
映射 至 KLBASE (01765000 之 后 的 地 址 ， 与 DL11 连接 的 终端 相对 应 的 
寄存 器 被 映射 至 DLBASE (0175610 ) 之 后 的 地 址 。NKL11 与 NDL11 分 
别 表示 系统 中 存在 的 KL11 与 DL11 接口 的 数量 。 系 统管 理 者 需要 根据 
系统 环境 修改 NKL11 与 NDL11 的 值 ， 并 重新 构筑 内 核 。 代 码 清单 13-5 
1 个 KL11 接口 ， 这 说 明 只 存在 一 台 供 系统 操作 台 使 用 
J ER ENES Jj o 


代码 清单 13-5 NKL11 fl NDL11 Cdmr/kl.c) 


1 #define NKL11 1 
2 itdefine NDL11 0 


KL11/DL11 设备 驱动 使 用 tty 结构 体 的 数组 kl111[] 管理 各 终端 的 信息 
(代码 清单 13-6 ) 。 设 备 的 小 编号 对 应 k111[] 的 数组 下 标 。 


代码 清单 13-6 kl11[] (dmr/kl.c) 


1 struct tty kl11[NKL11+NDL11]; 


KL11/DL11 设 备 驱 动 函 数 


在 代码 清单 13-7 的 示例 中 ， 对 于 cdevsw[ ] 的 大 编号 0， 注 册 了 下 述 
KL11/DL11 设备 驱动 函 
数 : klopen(). klclose(). klread(). klwrite(). klsgtty(). 


除了 上 上述 函数 ， 再 加 上 终端 处 理 结束 时 引发 中 断 的 处 理 函 数 
klxint()， 以 及 终端 输入 时 引发 中 断 的 处 理 函 数 klrint()， 即 构成 了 
KL11/DL11 设备 驱动 的 全 部 函数 。 


代码 清单 13-7 cdevsw[] Cconf.c) 





(*cdevsw[])() 


&klopen, &klclose,  &klread, &klwrite,  &klsgtty,  /* console */ 





13.2 23m H5) JT Jk RIZ: Hl] 


klopen() 

ient 是 用 于 打开 KL11 终端 的 设备 驱动 〈 表 13-12， 代 码 清单 13-8 
。 对 终端 的 特殊 文件 执行 系统 调用 open， 将 调用 注册 于 在 

i .d open 的 klopen(). 


DONA k111[] 取得 相应 的 tty 结构 体 ， 将 执行 进程 与 终端 相关 
联 。 


计算 该 终端 的 地 址 ， 对 tty 结构 体 和 寄存 右 进 行 初 始 化 设 定 。 


K 13-12  klopen() 的 参数 


| 
Eq v 
Y i bid 


代码 清单 13-8 klopen() (dmr/kl.c) 











1 klopen(dev, flag) 

2 { 

3 register char *addr; 

4 register struct tty *tp; 

5 

6 if(dev.d_minor >= NKL11+NDL11) { 
7 u.u_error = ENXIO; 

8 return; 

9 

10 tp = &k111[dev.d_minor]; 

11 if (u.u procp-»p ttyp == €) { 
12 u.u procp-»p ttyp - tp; 


13 tp-»t dev - dev; 


14 ) 


15 addr = KLADDR + 8*dev.d minor; 

16 if(dev.d minor) 

17 addr =+ KLBASE-KLADDR-8; 

18 if(dev.d minor >= NKL11) 

19 addr =+ DLBASE-KLBASE -8*NKL11^8; 
20 tp-»t addr - addr; 

21 if ((tp-»t state&ISOPEN) -- 0) ( 

22 tp-»t state - ISOPEN|CARR ON; 

23 tp-»t flags - XTABS|LCASE | ECHO | CRMOD; 
24 tp-»t erase - CERASE; 

25 tp-»t kill - CKILL; 

26 ) 

27 addr-»klrcsr =| IENABLE DSRDY |RDRENB ; 
28 addr-»kltcsr =| IENABLE; 

29 ) 





6-9 检查 小 编写 是 否 合适 。 


10 根据 小 编号 ， 从 kl111[] 取得 相应 的 tty 结构 体 。 


11714 ”如 果 试 图 打开 的 终端 进程 尚未 与 终端 相关 联 ， 则 将 刚才 取 
得 的 tty 结构 体 分 配 与 该 进程 ， 并 设 定 tty 结构 体 的 设备 编写。 
15-20 ”计算 终端 接口 寄存 器 的 基地 址 。 将 计算 式 进行 简化 后 得 到 
TRER. 

e 小 编号 0 : tp-»t addr = KLADDR 


e 小 编号 1-NKL11-1: tp->t_addr = KLBASE + 8 x( 小 编 
r1 
* -1) 


。 小 编号 NKL11~: tp-»t addr = DLBASE + 8 x( 小 编号 - 
NKL11) 


21~26 ”检查 终端 状态 ， 如 果 疝 未 打开 ， 则 对 tty 结构 体 进行 初始 
化 处 理 。 


27~28 ”对 终端 接口 的 寄存 器 进行 初始 化 。klrcsr 与 kltcsr 是 为 
了 操作 寄存 器 而 定义 的 结构 体 的 成 员 〔( 代 码 清单 13- 
9) 。IENABLE、DSRDY、RDRENB 是 为 了 设置 寄存 器 而 定义 的 值 


《代码 清单 13-10， 代 码 清单 13-11) 。 
代码 清单 13-9 klregs (dmr/kl.c) 


struct klregs { 
int klrcsr; 
int klrbuf; 


1 

2 

3 

4 int kltcsr; 
5 int kltbuf; 
6 


} 





代码 清单 13-10 IENABLE (tty.h) 


1 #define IENABLE 0100 


代码 清单 13-11 DSRDY fl RDRENB (dmr/kl.c) 

1 define DSRDY 02 

2 define RDRENB 01 
klclose() 
klclose() 用 于 对 KL11 进行 关闭 处 理 〈 表 13-13， 代 码 清单 13-12 
) 。 对 终端 的 特殊 文件 执行 系统 调用 close， 将 调用 注册 于 
cdevsw[].d_close 的 klclose()。 


根据 小 编号 从 k111[] 取得 相应 的 tty 结构 体 ， 刷 新 tty 结构 体 持 有 的 
队列 。 并 将 tty 结构 体 的 tty.t state 清 0. 


表 13-13 klclose() 的 参数 





代码 清单 13-12  klclose() ( dmr/kl.c) 


lclose(dev) 


register struct tty *tp; 


tp = &kli1[dev.d minor]; 
wflushtty(tp); 
tp-»t state - 0; 





wflushtty() 


wflushtty() 用 于 清空 队列 〈 表 13-14， 代 码 清单 13-132 。 如 果 
tty.t_outq 中 残留 了 数据 ， 则 进入 睡眠 状态 直到 数据 被 使 用 。 


将 清空 队列 的 处 理 在 flushtty() 中 进行 。 
K 13-14 ”wflushtty0 的 参数 








1 wflushtty(atp) 
2 struct tty *atp; 


3-1 

4 register struct tty *tp; 

5 

6 tp = atp; 

7 spl15(); 

8 while (tp->t outq.c cc) 1 

9 tp-»t state -| ASLEEP; 

10 sleep(&tp-»t outq, TTOPRI); 
11 } 

12 flushtty(tp); 


13 sp16() 


14 ) 


8-11 如果 tty.t outq 中 残留 了 数据 ， 则 将 tty 结构 体 设 置 为 
ASLEEP 状态 ， 然 后 使 进程 进入 睡眠 状态 。 当 tty.t_outq 变 为 空 
或 置 为 TTLOWAT 状态 (后 述 ) 时 进程 被 唤醒 。 

flushtty() 


flushtty() 用 于 清空 tty 结构 体 持 有 的 3 个 队列 ( 表 13-15, REA 
单 13-14 ) 。 


K 13-15 flushtty() 的 参数 





1 flushtty(atp) 
2 struct tty *atp; 


register struct tty *tp; 


register int sps; 


tp = atp; 

while (getc(&tp-»t canq) »- 0); 
while (getc(&tp-»t outq) »- 0); 
wakeup(&tp-»t rawq); 
wakeup(&tp-»t outq); 

sps = PS-»integ; 

spl15(); 

while (getc(&tp-»t rawq) »- 0); 
tp-»t delct = 0; 

PS-»integ - sps; 





8-9 将 tty.t_canq 和 tty.t_outq 清空 。 

10~11 唤醒 等 待 tty.t_rawq 和 tty.t_outq 被 清空 的 进程 。 
12~13 保存 PSW， 并 将 处 理 器 的 优先 级 设 为 5。 

14 将 tty.t_rawq 清空 。 

15 HT tty.t rawq 已 被 清空 ， 因 此 将 分 隔 符 计数 器 也 清 0。 
16 恢复 保存 的 PSW。 


13.3 ”终端 的 设 定 


gtty() 


gtty() 为 系统 调用 gtty 的 处 理 函 数 CK 13-17， 代 码 清单 13-15 ) 。 
该 函数 将 终端 的 相关 信息 Ctty 结构 体 的 数据 ) 读 取 至 用 户 空间 ， 所 取 
得 的 数据 与 保存 区 域 的 对 应 关系 如 表 13-16 所 示 。 


preme sgtty() 中 进行 。 该 函数 为 gtty() 与 stty() KJH K 


表 13-16 系统 调用 gtty 所 读 取 的 数据 


表 13-17 系统 调用 gtty 的 参数 








u.u arg[0] 用 于 存放 所 读 取 的 终端 信息 的 用 户 空 间 地 址 








用 于 打开 终端 特殊 文件 的 文件 描述 符 


代码 清单 13-15 gtty( ( dmr/tty.c) 


1 gtty() 

2 { 

3 int v[3]; 

4 register *up, *vp; 

5 

6 vp = V; 

7 sgtty(vp); 

8 if (u.u_error) 

9 return; 
10 up = u.u arg[0]; 
11 suword(up, *vp++); 
12 suword(++up, *vp++); 
13 suword(++up, *vp++); 
14 } 








7 调用 sgtty()， 设 定 其 参数 为 指向 用 于 存放 tty 结构 体 数据 的 
int[3] 的 指针 。 


8-9 ”如 果 在 执行 sgtty() 中 发 生 错误 则 返 
10-13 将 tty 结构 体 的 信息 读 取 至 用 户 空间 。 





stty() 


stty() 为 系统 调用 stty 的 处 理 函 数 CK 13-19， 代 码 清单 13-16) 。 
空间 的 数据 设 定 到 终端 (tty 结构 体 ) 。 设 定 的 数据 如 表 
13-18 所 示 。 


sgtty() 中 进行 。 该 函数 为 gtty() 与 stty() KJH K 


K 13-18 系统 调用 stty 所 设 定 的 数据 


>- o 





int[1] tty.t erase. tty.t kill 





表 13-19 系统 调用 stty 的 参数 








用 于 打开 终端 特殊 文件 的 文件 








m—— (int[3] ) 的 指针 ， 该 数据 将 被 写 入 tty 结构 体 中 


代码 清单 13-16 stty() (dmr/tty.c) 


tty() 


S 
{ 


register int *up; 


up = u.u arg[0]; 

u.u arg[0] fuword(up); 
u.u arg[1] fuword(++up); 
u.u_arg[2] fuword(++up); 
sgtty(0); 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 


He 
“~ 





5^8 u.u arg[] 中 容纳 用 户 程 序 指定 的 值 。u.u_arg[8] 对 应 
tty.t speed, u.u arg[1] 对 应 tty.t erase 和 
tty.t kill, u.u arg[2] 对 应 tty.t mode. 


9 调用 sgtty()。 通 过 将 参数 指定 为 0， 表示 对 tty 结构 体 进 行 
写 入 处 理 。 


sgtty() 


sgtty() 用 于 执行 stty() 和 gtty() 的 共用 人 处理 ( 表 13-20， 代 码 清 
单 13-17 ) 。 首 先 取得 与 已 打开 的 特殊 文件 相对 应 的 inode[ ] 元 素 ， 并 





确认 其 为 字符 设备 。 然 后 将 inode.i addr[0] 设 定 为 设备 编号 。 最 后 
使 用 大 编号 执行 在 cdevsw[].d sgtty 中 注册 的 k1sgtty(). 


K 13-20 sgtty() 的 参数 





代码 清单 13-17  sgtty() (dmr/tty.c) 


1 sgtty(v) 
2 int *v; 


register struct file *fp; 
register struct inode *ip; 


if ((fp = getf(u.u are[RO])) == NULL) 
return; 


ip = fp-»f inode; 

if ((ip-»i mode&IFMT) != IFCHR) ( 
u.u error - ENOTTY; 
return; 


} 
(*cdevsw[ip-»i addr[0].d major].d sgtty)(ip-»i addr[0], v); 





7-8 由 于 用 户 进程 的 re 保存 了 终端 的 文件 描述 符 ， 因 此 执行 
getf() 取得 相对 应 的 file[] 元 素 。 


9 获取 由 位 le[ |] 元素 所 指 同 的 inode[] 元 素 。 
10-13 WÈ inode[ ] 元 素 并 非 字 符 型 的 特殊 文件 则 出 错 。 
14 调用 用 于 设 定 终端 的 设备 驱动 。 


klsgtty() 


klsgtty() 为 用 于 设 定 及 读 取 tty 结构 体 的 KL11 设备 驱动 CK 13- 
21， 代 码 清单 13-18 ) 。 根 据 小 编号 从 k111[] 获取 相应 的 tty 结构 
体 ， 并 执行 ttystty(). 


表 13-21 klsgtty() 的 参数 





代码 清单 13-18 klsgtty( ( dmr/kl.c) 


1 klsgtty(dev, v) 
2 int *v; 
3 { 
register struct tty *tp; 


tp = &kl11[dev.d minor]; 
ttystty(tp, v); 
} 





ttystty() 

ttystty() 是 实际 上 对 tty 结构 体 进行 号 入 或 读 取 处 理 的 函数 《〈 表 13- 
22， 代 码 清单 13-19 ) 。 该 函数 由 设备 驱动 调用 。 参 数 av 为 0 时 进行 
写 入 ， 其 他 值 时 进行 读 取 。 


K 13-22 ttystty() 的 参数 








指向 tty 结构 体 的 指针 














0 : 将 u.u arg[] 中 的 数据 赋予 tty 结构 体 。 处 理 结束 时 返回 0 

















av | 0 以外: 将 tty 结构 体 的 数据 读 取 至 由 av 所 示 的 地 址 。 处 理 结束 时 返回 1 





代码 清单 13-19 ttystty() (dmr/tty.c) 


1 ttystty(atp, av) 
2 int *atp, *av; 


register  *tp, *v; 


tp - atp; 

if(v = av) ( 
*yr = tp->t speeds; 
v-»lobyte = tp-»t erase; 
v-»hibyte = tp-»t kill; 
v[1] = tp-»t flags; 
return(1); 


} 

wflushtty(tp); 

V = U.U arg; 

tp-»t speeds = *V++; 
tp-»t erase = v-»lobyte; 
tp-»t kill - v-»hibyte; 
tp-»t flags - v[1]; 
return(0); 





7-13 H tty 结构 体 的 处 理 。lobyte 和 hibyte 是 为 了 访问 2 
数据 的 低位 字 节 和 高 位 字 节 而 定义 的 结构 体 的 成 员 变 量 《〈 代 三 
清单 13-20) 。 











代码 清单 13-20 lobyte 和 hibyte (param.h) 
1 struct 
2 { 
3 char lobyte; 
4 
5 


char hibyte; 


E 





14-20 对 tty 结构 体 进行 写 入 的 处 理 。 首 先 执行 wflushtty() 
清空 队列 。 


13.4 从 终端 输入 文字 
从 终端 输入 文字 时 的 处 理 如 下 所 示 (图 13-6 ) 。 


司 边 设备 


内 核 


a 


tty.t rawq tty.t canq 


傅 入 终端 Q) 中 断 
z H KL11| 一 一 一 全 











图 13-6 从 终端 输入 文字 

1. 从 终端 输入 数据 后 ， 数 据 将 被 赋予 KL11/DL11 的 输入 寄存 器 
2.KL11DL11 的 寄存 器 设 定 了 数据 后 将 引发 中 断 

3. 中 断 处 理 函 数 从 KL1LDL11 的 输入 寄存 器 读 取 数据 ， 对 其 进行 适当 的 
变换 ， 并 对 特殊 文字 及 分 隔 符 进行 处 理 ， 然 后 将 数据 追加 至 tty.t _ 
rawq 

在 3. 的 处 理 中 ， 为 了 避免 在 向 tty.t_rawq 追加 数据 时 缓冲 区 发 生 游 
出 的 问题 ， 当 tty.t rawq 中 的 数据 达到 TTYHOG (代码 清单 13-21 ) 
件 时 ， 队 列 将 被 清空 。 

代码 清单 13-21 TTYHOG (tty.h) 


1 #define TTYHOG 256 


klrint() 
klrint() 为 中 断 处 理 函 数 ， 用 于 处 理 从 终端 输入 数据 时 发 生 的 中 断 


CK 13-23, [CUIR 13-220 。 首 先 根据 小 编号 从 k111[] 取得 相应 
的 tty 结构 体 ， 同 时 从 KL11 的 输入 寄存 器 中 获取 输入 的 数据 。 


设置 输入 控制 寄存 器 ， 使 其 处 于 可 接收 状态 ， 然 后 执行 ttyinput() 将 
输入 的 数据 追加 人 至 tty.t_rawq。 


表 13-23 klrint() 的 参数 





lrint(dev) 


register int c, *addr; 
register struct tty *tp; 


tp = &klii[dev.d minor]; 

addr = tp-»t addr; 

c = addr-»klrbuf; 

addr-»klrcsr -| RDRENB; 

if ((c&0177)--0) 
addr-»kltbuf = c; 


ttyinput(c, tp); 





10-11 "UA BUS. WT HUBS SET in UCEL/J e 
条 。 这 是 为 了 保险 起 见 而 进行 的 处 理 。 


ttyinput() 


因 终 端 输入 引发 中 断 的 处 理 函 数 将 调用 ttyinput() CX 13-24， 代 码 
清单 13-23 ) 。 该 函数 将 数据 仍 加 至 tty.t nrawq. 


此 处 将 进行 下 面 这 些 特 殊 处 理 。 


CR 模式 时 ; KAPERAN” 


TE RAW 以 外 的 模式 时 ， 如 果 输 入 了 FS 和 DEL， 则 将 该 终端 控制 
的 所 有 进程 发 送 SIGQIT (FS 时 ) 或 SIGINT (DEL 时 ) 信和 号 


如 果 tty.t rawq 保存 的 数据 件数 大 于 等 于 TTYHOG 时 ， 将 清空 全 
部 3 个 队列 


如 果 终 端 只 能 处 理 大 写 文 字 时 ， 将 输入 的 大 写 文 字 变 为 小 写 文 字 
RAW 模式 ， 或 输入 了 换行 符 或 EOT 时 ， 在 输入 文字 后 追加 分 隔 符 
(0377) ， 并 将 其 追加 至 tty.t_rawq， 同 时 递增 分 隔 符 计 数 器 的 
值 


ECHO 模式 时 ， 将 输入 的 文字 输出 至 终端 





表 13-24 ttyinput() 的 参数 





1 ttyinput(ac, atp) 
2 struct tty *atp; 
3 { 


register int t flags, c; 
register struct tty *tp; 


tp = atp; 

c = ac; 

t flags - tp-»t flags; 

if ((c =& 0177) == '\r' && t flags&CRMOD) 
C= An 


if ((t flags&RAW)--0 && (c--CQUIT || c--CINTR)) ( 


13 signal(tp, c--CINTR? SIGINT:SIGQIT); 


14 flushtty(tp); 

15 return; 

16 

17 if (tp-»t rawq.c cc»-TTYHOG) ( 

18 flushtty(tp); 

19 return; 

20 

21 if (t flags&LCASE && c»-'A' && c<='Z') 
22 C =+ 'a'-'A'; 

23 putc(c, &tp-»t rawq); 

24 if (t flags&RAW || c=='\n' || c--0ee4) { 
25 wakeup(&tp-»t rawq); 

26 if (putc(0377, &tp-»t rawq)--0) 

27 tp->t delct++; 

28 

29 if (t flags&ECHO) { 

30 ttyoutput(c, tp); 

31 ttstart(tp); 

32 } 

33 ) 





107-11 CR 模式 时 的 处 理 。 
12~16 ”发 送信 号 的 处 理 。 
17-20 WR tty.t_rawq 中 保存 的 数据 过 多 ， 则 将 3 个 队列 全 部 





清空 。 
21-22 如果 终端 只 能 处 理 大 写 文 字 ， 则 将 输入 的 大 写 文 字 变 为 小 
写 文字 。 


23 ”使 用 putc() 将 输入 的 文字 退 加 至 tty.t_rawq。 
24-28 ”对 分 隔 符 的 处 理 。 


29~32 ECHO 模式 时 的 处 理 。 


13.5 ”该 取 输 入 的 数据 
将 输入 的 数据 读 取 至 用 户 空间 的 流程 如 下 所 示 (图 13-7 ) 。 





周边 设备 内 核 
[ tytrawq ]—»[ tty.tcang | 
输入 终端 中 断 





| 4— 33 





图 13-7 读 取 输入 的 数据 
1. 用 户 程 序 对 终端 执行 系统 调用 read 


2. 从 tty.t _ rawq 读 取 数据 ， 将 其 退 加 至 tty.t _ canq， 同 时 对 下 
列 特殊 文字 进行 处 理 : 删除 1 个 文字 G ， 删 除 1 行文 字 〈@) ， 转 义 
AREE C 。 将 输入 数据 从 tty.t ”rawq 转 存 到 tty.t | cang 直至 
遇 到 分 隔 符 

3. 将 tty.t _ cang 数据 读 取 至 用 户 空 间 

klread() 


klread() 是 将 从 终端 输入 的 数据 读 取 至 用 户 空间 的 设备 驱动 函数 〈 表 
13-25， 代 码 清单 13-24 ) 。 对 终 病 的 特殊 文件 执行 系统 调用 read 后 ， 
将 执行 在 cdevsw[].d. read 中 注册 的 klread()。 

根据 小 编号 从 kl111[] 取得 相应 的 tty 结构 体 ， 并 执行 ttread(). 


表 13-25 klread() 的 参数 





lread(dev) 


ttread(&klii1[dev.d minor]); 





ttread() 


ttread() 在 read 时 由 设备 驱动 调用 ( 表 13-26， 代 码 清 单 13-25 ) 。 
首先 检查 是 否 已 打开 终端 ， 然 后 执行 canon() 将 数据 从 tty.t rawq 
传送 至 tty.t_canq， 再 从 tty.t_cand 向 用 户 空间 传送 数据 。 


表 13-26 ttread() 的 参数 














1 ttread(atp) 
2 struct tty *atp; 


31 

4 register struct tty *tp; 

5 

6 tp = atp; 

7 if ((tp-»t state&CARR ON)--0) 

8 return; 

9 if (tp-»t canq.c cc || canon(tp)) 


10 while (tp-»t canq.c cc && passc(getc(&tp-»t canq))»-0); 
11 ) 


7-8 如果 未 打开 终端 则 不 作 任 何 处 理 直 接 返回 。 


9~10 WÈ tty.t_cangq 中 残留 了 数据 ， 或 是 canon() 的 结果 不 
为 6， 则 使 用 passc() 回 用 户 空 间 传送 tty.t canq 中 的 数据 。 


canon() 


canon() 用 于 从 tty.t_rawq 向 tty.t cang 传送 数据 (Xe 13-27, 4X 
码 清单 13-28 ) 。 如 果 向 tty.t canq 成 功 追 加 了 数据 则 返回 1. 


处 理 时 使 用 canonb[] 作为 工作 区 域 〈 代 码 清单 13-26， 代 码 清单 13-27 
) 。 从 tty.t_rawq 的 起 点 开始 将 数据 转 存 至 canonb[ ] 直至 过 到 分 隔 
^j (0377 ) ， 然 后 在 进行 删除 1 个 文字 、 删 除 1 行文 字 和 转 义 处 理 的 
同时 ， 再 将 数据 追加 至 tty.t canq (B 13-8) 。 





队列 的 起 点 .«—— — — ——— tty.t rawg 





处 理 单位 处 理 单位 


canonb ] 


tty.t canq 


— > 队列 的 起 点 


图 13-8 canon() 


bp 是 canonb[] 中 的 工作 指针 ， 当 bp 之 前 的 文字 为 “时 ， 利 用 
maptab[] 进行 转 义 处 理 。 但 是 如 果 bp 之 前 的 倒数 第 2 个 文字 也 
为 ^* 时 ， 则 认为 ^* 是 已 经 转 义 过 的 文字 。 


当 从 tty.t_rawq 获取 的 文字 为 用 于 删除 1 个 文字 的 特殊 文字 时 ， 将 
bp 癌 前 移动 1 个 文字 的 位 置 。 当 为 用 于 删除 1 行文 字 的 特殊 文字 时 ， 
将 bp 移动 至 作为 处 理 起 点 的 &canonb[2] (图 13-9)。 





canonbl ] 


Uto oso o5 e 
m TEN ML 
4 A i 


p. wo Bp 
但 是 如 果 bp 之 前 倒数 第 2 ”如果 bp 之 前 的 文字 为 \ 则 进 
个 文字 也 为 \ 则 认为 倒 行 转 义 处 理 
数 第 1 个 文字 的 \ 为 经 过 
转 义 处 理 的 文字 


canonbl ] 


bp 
删除 1 行文 字 时 需要 将 删除 1 个 文字 时 将 
bp 移动 至 &canonbI2] bp 前 移 一 个 位 置 


图 13-9  canonb[] 的 处 理 


代码 清单 13-26 canonb (system.h) 


1 char canonb[CANBSIZ]; 


代码 清单 13-27 CANBSIZ (param.h) 


1 #define CANBSIZ 256 


K 13-27 canon() 的 参数 





atp 指向 tty 结构 体 的 指针 


代码 清单 13-28 canon() (dmr/tty.c) 





1 canon(atp) 
2 struct tty *atp; 


3 1 
4 register char *bp; 
5 char *bp1; 
6 register struct tty *tp; 
7 register int c; 
8 
9 tp = atp; 
10 spl5(); 
11 while (tp->t delct--0) { 
12 if ((tp-»t state&CARR ON)--0) 
13 return(0); 
14 sleep(&tp-»t rawq, TTIPRI); 
15 } 
16 spl0(); 
17 loop: 
18 bp = &canonb[2]; 
19 while ((c2getc(&tp-»t rawq)) >= ©) ( 
20 if (c--0377) ( 
21 tp-»t delct--; 
22 break; 
23 
24 if ((tp-»t flags&RAW)--0) ( 
25 if (bp[-1]!= AN { 
26 if (c==tp->t erase) { 
27 if (bp > &canonb[2]) 
28 bp--; 
29 continue; 
30 } 
31 if (c==tp->t kill) 
32 goto loop; 
33 if (c--CEOT) 
34 continue; 
35 ) else 
36 if (maptab[c] && (maptab[c]--c || (tp->t flags&LCASE))) ( 
37 if (bp[-2] != " NV.) 
38 c = maptab[c]; 
39 bp--; 
40 } 


42 *bp++ = C; 


43 if (bp>=canonb+CANBSIZ) 
44 break; 

45 } 

46 bp1 = bp; 

47 bp = &canonb[2]; 

48 c = &tp-»t cang; 

49 while (bp<bp1) 

50 putc(*bp++, c); 

51 return(1); 

52 } 





10-16 WR tty.t_rawq 中 的 数据 不 包含 分 隔 符 ， 且 终端 处 于 未 





打开 状态 ， 则 返回 0。 人 否则 进入 睡眠 状态 ， 直 到 分 隔 符 被 退 加 至 
tty.t rawq. 


18 将 bp 设 定 为 处 理 起 点 &canonb [2]. 


19 以 文字 为 单位 从 tty.t_rawq 中 获取 数据 ， 并 将 其 追加 至 
canonb[]， 直 至 遇 到 分 隔 符 。 


20-23 ” 遇 到 分 隔 符 时 ， 递 减 分 隔 符 计 数 器 并 退出 循环 。 
24-41 如果 不 为 RAW 模式 ， 且 bp 之 前 的 文字 为 “时 ， 根据 
maptab[] 进行 转 义 处 理 。 但 是 如 果 bp 之 前 倒数 第 2 个 文字 也 
KVP, MAX bp 之 前 的 ^ 为 已 经 经 过 转 义 的 文字 。 

bp 之 前 的 文字 不 为 ^* 时 ， 进 行 下 述 处 理 。 


。 删除 1 个 文字 时 将 bp 前 移 1 位， 但 不 会 移动 至 小 于 





&canonb[2] 的 位 置 
e 删除 1 行文 字 时 返回 loop 处 (基本 等 同 于 将 bp 前 移 至 
&canonb[2]) 


。 如 果 为 EOT 时 继续 处 理 下 一 个 文字 
42 ”将 文字 追加 至 canonb[]. 


43~44 ”如果 canonb[] 已 无 空间 ， 则 退出 循环 。 





46-50 将 &canonb[2] 至 bp 所 对 应 范围 的 数据 追加 至 
tty.t canq. 


51 如 果 canon() 的 处 理 正常 结束 则 返回 1. 


13.6 [n] 2 »m n H3 2S 
向 终端 输出 数据 的 流程 如 下 所 示 (图 13-10) 。 





司 边 设备 
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tty.t outq 
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图 13-10 ”向 终端 输出 数据 

1. 用户 程序 对 终端 执行 系统 调用 write 

2. 用 户 空 间 的 数据 被 退 加 至 tty.t ^ outq 

3. 将 位 于 tty.t ”outq 起 始 位 置 的 数据 赋予 KL11 寄 存 器 ， 开 始 向 终 
端 输出 数据 

4. 当 癌 终端 输出 数据 的 处 理 结束 后 ，KL11 将 引发 中 断 。 如 果 tty.t _ 
outq 中 残留 了 数据 ， 中 断 处 理 函 数 将 继续 进行 输出 处 理 

当 上 述 2 中 向 tty.t_outq 追加 数据 时 ， 会 根据 终端 的 设置 对 输出 文字 
进行 变换 (例如 ， 当 终端 只 能 处 理 大 写 文字 时 ， 将 小 写 文 字 变 为 大 写 文 
字 ) 。 

在 处 理 一 部 分 特殊 文字 时 会 花费 较 长 时 间 《 例 如 会 发 生 移动 打印 头 的 处 
理 ) 。 因 此 ， 设 备 驱 动 在 此 类 处 理 结束 前 将 延迟 输出 处 理 。 在 2 中 向 


tty.t_outq 追加 数据 时 ， 如 果 数 据 为 特殊 文字 ， 则 将 额外 癌 
tty.t_outq 追加 1 字 节 长 的 数据 (如 表 13-28 所 示 ) . 在 3 的 处 理 中 











将 tty.t outq 的 数据 赋予 KL11 寄存 器 时 ， 如 果 从 tty.t_outq 中 取 
得 的 1 字 节 长 的 数据 的 最 高 比特 位 为 1， 则 执行 timeout() 并 在 指定 

tick 发 生 后 再 继续 进行 输出 处 理 。 在 此 延迟 处 理 过程 中 ， 为 tty£ 5 
设置 TIMEOUT 标志 位 。 


表 13-28 ”延迟 指示 数据 


为 了 避免 tty.t_outq 中 保存 太 多 数据 ， 定 义 了 TTHIWAT (High water 
mark) 和 TTLOWAT (Low water mark) (代码 清单 13-29 ) 。 在 2 中 向 
tty.t_outq 追加 数据 时 ， 如 果 队 列 中 的 数据 件数 文字数) 超过 了 
TTHIWAT， 则 在 向 tty.t_outq 追加 数据 前 ， 首 先 执 行 上 述 3 的 处 理 以 
同 终端 输出 文字 ， 然 后 进入 睡眠 状态 。 当 tty.t_outq 中 的 数据 件数 
(文字 数 ) 通过 向 终端 输出 数据 变 为 TTLOWAT 时 ， 处 于 睡眠 状态 的 进 
程 被 唤醒 ， 并 将 继续 向 tty.t_outq 追加 数据 。 


代码 清单 13-29 TTHIWAT 和 TTLOWAT (tty.h) 




















1 #define TTHIWAT 50 

2 sdefine TTLOWAT 30 
klwrite() 
klwrite() 是 用 于 向 终端 进行 输出 的 设备 驱动 函数 〈( 表 13-29， 代 码 清 
单 13-30 ) 。 在 对 终端 中 的 特殊 文件 执行 系统 调用 write 后 ， 将 会 调用 在 
cdevsw[].d write 中 注册 的 Klwrite(). 


根据 小 编号 从 k111[] 获取 相应 的 tty 结构 体 ， 并 执行 ttwrite(). 





K 13-29 klwrite() 的 参数 





代码 清单 13-30  klwrite() (dmr/kl.c) 


klwrite(dev) 
{ 


1 
2 
3 ttwrite(&kl1ii[dev.d minor]); 
4j 





ttwrite() 


ttwrite() 为 终端 共用 处 理 函 数 ， 由 设备 驱动 在 向 终端 进行 输出 时 调用 
(XX 13-30， 代 码 清单 13-31 ) 。 


首先 执行 ttyoutput()， 将 用 户 程序 指定 的 数据 全 部 追加 至 
tty.t_outq， 然 后 执行 ttstart() 开始 向 终端 进行 输出 。 


但 是 ， 如 果 tty.t_outq 中 保存 了 过 多 的 数据 ， 需 要 先 将 其 输出 至 终端 
以 腾空 tty.t outq. 


表 13-30 ttwrite() 的 参数 








代码 清单 13-31 ttwrite() ( dmr/tty.c) 


1 ttwrite(atp) 


2 struct tty *atp; 

3 { 

4 register struct tty *tp; 

5 register int c; 

6 

7 tp = atp; 

8 if ((tp-»t state&CARR ON)--0) 

9 return; 
10 while ((c2cpass())»-0) { 
11 spl5(); 
12 while (tp-»t outq.c cc » TTHIWAT) ( 
13 ttstart(tp); 
14 tp-»t state -| ASLEEP; 
15 sleep(&tp-»t outq, TTOPRI); 
16 } 
17 sple(); 
18 ttyoutput(c, tp); 
19 } 
20 ttstart(tp); 
21.3 





8-9 如 条 终端 处 于 未 打开 的 状态 则 不 做 任何 处 理 立 即 返 回 。 


10 ”对 用 户 程序 传送 的 数据 进行 逐 字 处 理 。 

12~16 如果 tty.t_outq 中 保存 了 超过 TTHIWAT 的 数据 ， 执 行 
ttstart() 促使 系统 进行 输出 处 理 ， 同 时 设置 AsLEEP 标志 位 进入 
睡眠 状态 。 当 tty.t outq 中 的 数据 减少 至 TTLOWAT 时 ， 终 端 输 
出 结束 并 引发 中 断 ， 进 程 将 被 该 中 断 的 处 理 函 数 唤醒 。 

18 执行 ttyoutput()， 将 数据 逐 字 退 加 人 至 tty.t outq. 


20 执行 ttstart() 开始 癌 终端 进行 输出 。 





ttyoutput() 


ttyoutput() HFI} tty.t_outq EJ 1 ALF CÈ 13-31， 代 码 清单 
13-32 ) 。 该 函数 执行 下 述 特殊 处 理 。 


e 如 果 不 处 于 RAW 模式 ， 且 当前 文字 为 EOT 时 ， 不 进行 追加 处 
H. 


。 WRAT XTABS 模式 ， 且 当前 文字 为 “tb 时， 输出 空白 使 打印 头 
移动 至 以 8 个 文字 为 间距 的 下 一 个 位 置 。 


。 如 条 终 端 只 能 处 理 大 写 文字 ， 则 将 小 写 文字 变 为 大 写 文 字 ， 并 将 终 
端 无 法 处 理 的 符号 变 为 反 斜 线 和 终端 能 够 处 理 的 符号 的 组 合 。 


e. CR 模式 时 将 ^\n” 变 为 ^\r\n”。 
此 外 ， 当 特殊 处 理 导致 处 理 时 间 变 长 时 ， 同 tty.t_outq 追加 额外 的 1 
字 节 数据 ， 表 示 进 行 输出 延迟 处 理 。 特 殊 处 理 通 过 相应 的 partab[] 元 
素 的 低位 比特 进行 判断 。 


表 13-31 ttyoutput() 的 参数 


[m — 
EN B i a 


代码 清单 13-32 ttyoutput() (dmr/tty.c) 














1 ttyoutput(ac, tp) 
2 struct tty *tp; 


31 

4 register int c; 

5 register struct tty *rtp; 

6 register char *colp; 

7 int ctype; 

8 

9 rtp - tp; 

10 C - ac&0177; 

11 if (c22004 && (rtp-»t flags&RAW)--0) 
12 return; 

13 if (c=='\t' && rtp-»t flags&XTABS) { 
14 do 

15 ttyoutput(' ', rtp); 

16 while (rtp-»t col&07); 


17 return; 


18 
19 
20 
21 
22 
23 
24 
25 
26 


27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 


} 
if (rtp->t flags&LCASE) { 
colp = "({)}!|^~" "; 
while(*colp++) 
if(c == *colp++) { 
ttyoutput('\\', rtp); 
c = colp[-2]; 
break; 


} 


if ('a'<=c && c<='z') 
c =+ 'A' - 'a'; 

} 

if (c=='\n' && rtp-»t flags&CRMOD) 
ttyoutput('NAr', rtp); 

if (putc(c, &rtp-»t outq)) 
return; 

colp = &rtp-»t col; 

ctype - partab[c]; 

c =ð; 

switch (ctype&077) { 

















/* 一 般 处 理 */ 
case 0: 
(*colp)++; 





/* 不 做 显示 */ 
case 1: 
break; 


/* 删除 之 前 的 1 个 文字 */ 
Case 2: 
if (*colp) 
(*colp)--; 
break; 


/* 换行 */ 
case 3: 
ctype - (rtp-»t flags »» 8) & 03; 
if(ctype -- 1) { 
if (*colp) 
c = max((*colp»»4) + 3, 6); 
) else 
if(ctype -- 2) { 
c = 6; 
} 
*colp = 6; 
break; 





66 — /* 水 平 制 表 符 */ 























67 case 4: 

68 ctype = (rtp-»t flags »» 10) & 03; 
69 if(ctype -- 1) ( 

70 c= 1 - (*colp | ~07); 
71 if(c « 5) 

72 c =ð; 

73 } 

74 *colp =| 07; 

75 (*colp)++; 

76 break; 

77 

78 /* 垂直 方向 的 处 理 */ 

79 case 5: 

80 if(rtp-»t flags & VTDELAY) 
81 c = 0177; 

82 break; 

83 

84 /* CR */ 

85 case 6: 

86 ctype - (rtp-»t flags »» 12) & 03; 
87 if(ctype -- 1) ( 

88 c = 5; 

89 ) else 

90 if(ctype -- 2) { 

91 c = 10; 

92 } 

93 *colp = 0; 

94 

95 if(c) 

96 putc(c|0200, &rtp-»t outq); 
97 ) 





11412 对 EOT 的 处 理 。 


13418 XTABS 模式 时 的 处 理 。 
19-29 ” 当 终 端 只 能 处 理 大 写 文 字 时 的 处 理 。 
30-31 CR 模式 时 的 处 理 。 将 ”首先 追加 至 tty.t_outq。 


32-33 ”向 tty.t_outq 追加 1 个 文字 。 





35 ”从 此 处 开始 为 输出 延迟 判断 处 理 。 如 果 需 要 的 话 调整 代表 打印 
头 水 平 位 置 的 tty.t_col， 向 tty.t_outq 追加 额外 的 1 字 节 数 
据 ， 表 示 进 行 输出 延迟 处 理 〈 参 照 表 13-32) 。 根 据 tty.t flags 
的 值 不 同 ， 延 迟 时 间 也 有 可 能 发 生变 化 。 具 体 请 参见 UPM(2) 中 关 
于 系统 调用 stty 的 说 明 。 


表 13-32 ”延迟 时 间 和 tty.t_col 的 位 置 


延迟 时 间 


删除 之 
前 的 1 
个 文字 





换行 类 型 为 1 时， 根据 当前 打印 头 在 XX 方 同 的 位 置 ， 
选择 在 X/16+3 和 6 中 较 大 的 值 。 换 行 类 型 为 2 时 设 定 
延迟 时 间 为 6， 此 外 为 0 





水 平 制 表 符 类 型 为 1 时 ， 根 据 当 前 打印 头 的 位 置 与 8 
的 倍数 之 间 的 差 值 ， 所 得 到 的 值 也 有 所 不 同 。 如 果 差 
值 大 于 等 于 5 则 为 该 差 值 ， 否 则 为 0 









































如 果 垂 直方 癌 的 处 理会 导致 延迟 ， 则 将 延迟 时 间 设 定 
为 0177【〈 延 迟 时 间 最 大 值 ) ， 否 则 为 0 




















CR 类 型 为 1 时 将 延迟 时 间 设 定 为 5，CR 类 型 为 2 时 
设 定 为 10， 此 外 为 0 





ttstart() 
ttstart() 是 问 终 端 进行 输出 的 函数 〈 表 13-33， 代 码 清单 13-33 ) 。 
如 果 输 出 的 1 字 节 数据 的 最 高 位 比特 为 1， 则 进行 输出 延迟 处 理 。 


表 13-33 ttstart() 的 参数 





1 ttstart(atp) 
2 struct tty *atp; 


register int *addr, c; 
register struct tty *tp; 
struct ( int (*func)(); ); 


tp = atp; 

addr = tp-»t addr; 

if (tp-»t state&SSTART) ( 
(*addr.func)(tp); 
return; 


j 
if ((addr-»tttcsr&DONE)--0 || tp-»t state&TIMEOUT) 
return; 
if ((csgetc(&tp-»t outq)) >= €) { 
if (c«z0177) 
addr-»tttbuf = c | (partab[c]&0e200); 
else ( 
timeout(ttrstrt, tp, c&0177); 
tp-»t state -| TIMEOUT; 





10-13 与 KLII/DL11 无 关 的 处 理 。 在 一 部 分 终端 接口 中 使 用 。 


14~15 如果 终端 处 于 发 送 处 理 或 发 送 延 迟 处 理 中 则 返回 。tttcsr 
是 为 了 操作 终端 接口 的 发 送 状 态 寄存 器 而 定义 的 结构 体 的 成 员 变 量 
《代码 清单 13-34) 。 


代码 清单 13-34 用 于 操作 接 # 和 寄存 器 的 结构 体 Cdmr/tty.c) 


struct ( 
int ttrcsr; 
int ttrbuf; 


1 

2 

3 

4 int tttcsr; 
5 int tttbuf; 
6 


? 





16-22 如果 tty.t outq 中 存在 数据 ， 首 先 从 队列 的 头 部 取得 1 
个 文字 。 如 果 所 取得 的 1 字 节 数据 包含 7 比特 信息 则 判断 其 为 〈7 
比特 的 ) ASCII 码 ， 将 偶 校 验 位 追加 至 最 高 位 比特 ， 并 将 该 数据 赋 
予 终端 接口 的 发 送 数据 寄存 器 。 当 设置 了 发 送 数据 寄存 器 后 ， 终 端 
输出 处 理 将 被 启动 。 


最 高 位 比特 为 1 时 表示 需要 进行 延迟 处 理 。 在 执行 timeout() 并 
经 过 由 所 取得 数据 的 低位 7 比特 所 示 的 tick 数 后 ， 执 行 
ttrstrt(). tty 结构 体内 表示 设置 了 正在 进行 延迟 处 理 的 
TIMEOUT 标志 位 。 





ttrstrt() 

ttrstrt() H ttstart() 注册 至 callout[]， 在 所 设 定 的 时 刻 由 
clock() 进行 调用 〈 表 13-34， 代 码 清 单 13-35 ) 。 当 解除 了 TIMEOUT 
状态 后 ， 该 函数 将 执行 ttstart() 继续 进行 输出 处 理 。 


表 13-34 ttrstrt(0) 的 参数 








L~~ T Ef 


代码 清单 13-35 ttrstrt() (dmr/tty.c) 


trstrt(atp) 


register struct tty *tp; 


tp = atp; 
tp-»t state =& ~TIMEOUT ; 
ttstart(tp); 





klxint() 

klxint() 为 终端 输出 处 理 结 束 后 引发 中 断 的 处 理 函 数 〈 表 13-35, fX 
码 清 单 13-36 ) 。 根 据 小 编号 从 k111[] 获取 相应 的 tty 结构 体 ， 并 执 
^T ttstart() 继续 终端 的 输出 处 理 。 


表 13-35 klxint() 的 参数 


lxint(dev) 


register struct tty *tp; 


tp = &klii1[dev.d minor]; 

ttstart(tp); 

if (tp->t outq.c cc == 0 || tp-»t outq.c cc == TTLOWAT) 
wakeup(&tp-»t outq); 





6 执行 ttstart()， 如 果 tty.t_outq 中 残留 了 数据 ， 则 继续 向 
终端 输出 文字 。 


7~8 WR tty.t outq 中 不 再 有 数据 ， 或 者 已 使 用 了 一 部 分 时 ， 
唤醒 正在 等 待 tty.t outq 中 的 数据 被 消耗 的 进程 。 


13.7 小 结 

内 核 提供 了 对 电 传 终端 处 理 的 支持 。 

系统 用 户 通过 电 传 终端 与 系统 进行 交流 。 

最 少 存在 工 台 供 系 统 操作 台 使 用 的 终端 。 

多 位 用 户 可 以 使 用 多 台 终端 同时 操作 系统 。 

终端 具有 3 个 缓冲 区 队列 ， 在 系统 与 终端 间 适 当 变换 数据 并 传送 。 


第 VIL 部 分 局 动 系统 


本 书 的 最 后 将 介绍 系统 是 如 何 局 动 的 ,第 VIE 部 分 会 对 下 述 内 容 进行 说 
明 。 





E | M d 
d 


。 虚拟 地 K 空 间 如 何 从 无 效 状态 迁移 至 有 效 状态 
通过 阅读 本 部 分 的 内 容 ,读者 将 会 了 解 系统 是 如 何 进 入 可 执行 状态 的 。 


第 14 草 局 动 系 统 


14.1 启动 的 流程 
UNIX V6 的 启动 流程 如 下 所 示 (图 14-12 。 


1. 保存 在 ROM 中 的 引导 装 入 程序 ， 将 位 于 根 磁盘 块 编号 0 处 的 引导 程 
序 读 取 至 内 存 地 址 0 的 位 置 并 执行 。 


2. 引导 程序 从 根 磁盘 的 文件 系统 将 /unix、Vrkunix 等 内 核 程序 的 主 程 
序 读 取 至 内 存 地 址 0 的 位 置 并 执行 。 


3. 内 核对 系统 进行 初始 化 。 
ROM 
引导 装 入 程序 














内 存 物理 地 址 





0 
根 磁盘 
0 | 引导 程序 
| EN 
逐步 读 取 容量 较 大 的 程序 


文件 系统 


/unix — 内 核 程序 主 程序 
/rkunix 


图 14-1 启动 的 流程 


为 了 局 动 系统 需要 将 内 核 程 序 读 取 人 至 内 存 ， 但 是 内 核 程序 约 有 40KB, 
JO CHINO 容量 很 小 的 ROM 而 言 是 无 法 接受 的 。 因 此 ， 需 要 首先 执 
行 可 以 容纳 在 ROM 中 的 简单 程序 ， 再 读 取 较 大 较 复 杂 的 引导 程序 .……. 
如 此 逐步 读 取 容 量 较 大 的 程序 。 


系统 管理 者 在 执行 /etc/mkfs 构筑 文件 系统 时 ， 将 引导 程序 放置 于 块 
设备 编写 为 0 的 块 中 。 


代码 清单 14-1 给 出 的 是 位 于 内 核 主 程序 低位 地 址 处 的 代码 。 第 工行 的 . 
= 0^. 表示 当 程 序 被 读 取 至 内 存 时 ， 此 处 为 地 址 0 的 位 置 。 首 先 执行 的 
指令 是 第 2 行 的 br 1f。br ATX F) 指令 ，1f 表示 跳 转 至 前 方 
第 1 个 标签 的 位 置 。 跳 转 至 标签 后 执行 jmp start， 将 控制 权 转 交 给 

start. 


代码 清单 14-1 启动 Cow.s) 


. = 40^. 

.globl start, dump 

1: jmp start 
jmp dump 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 


m 





start 

start (代码 清单 14-2 ) 进行 下 述 处 理 。 
。 对 内 核 APR 进行 初始 化 
。 激活 MMU 使 之 有 效 
e 执行 main() 


执行 start 时 尚未 激活 MMU， 处 于 需要 直接 处 理 物理 地 址 的 状态 。 内 
核 可 以 使 用 16 比特 的 数据 (地 址 ，， 但 物理 地 址 为 18 比特 ， 因 此 只 能 


访问 物理 地 址 的 低位 16 比特 的 区 域 (090177777 ) 。 此 外 ，PSW 的 当 
前 模式 为 内 核 模 式 (00 ) 。 


start 首先 进行 内 核 空 间 的 设 定 。 对 内 核 APR 进行 如 表 14-1, B| 14-2 
所 示 的 设 定 。 


e APR0~5 被 赋予 物理 地 址 0~0137777 的 区 域 。 此 区 域 的 物理 地 址 = 
虚拟 地 址 ， 内 核 程 序 被 置 于 该 区 域 的 起 始 位 置 。 


e APR6 被 赋予 位 于 内 核 程序 后 方 长 度 为 1KB 的 区 域 。 此 区 域 被 分 配 
给 proc[8] 的 PPDA (Cuser 结构 体 和 内 核 栈 ) 。APR6 表示 执行 进 
程 的 PPDA， 当 执行 进程 发 生 切 换 时 ，PAR6 的 值 也 将 发 生 切 换 。 


e. APR7 被 赋予 物理 地 址 的 最 高 位 地 址 0760000~0777777。 此 区 域 被 
分 配给 PDP-11/40 及 周边 设备 的 寄存 器 。 内 核 通 过 操作 此 区 域 的 内 
存 ， 对 PDP-11/40 及 周边 设备 进行 操作 。 





e 栈 指针 被 设 定 为 指向 APR6 对 应 区 域 的 末尾 。 


APR 中 ， 除 了 PAR6 以 外 ， 在 系统 运行 时 ， 值 是 不 会 发 生变 化 


表 14-1 内 核 APR 的 初始 设 定 


RW，128 个 
077406 | 0~017777 0~017777 块 〈 以 64 字 
节 为 单位 ) 




















个 
a 077406 |020000-037777 — |020000-037777 "d E] 
个 
Ir 077406 |040000—057777 — |040000-057777 E 128 


0600 077406 060000077777  |060000-077777 |RW. 128^ 





AM 

m 077406 | 0100000~0117777 |0100000-0117777 "uh s 

AM 

a 077406 | 0120000-0137777 |0120000-0137777 n 1:29 
0 



































FH 


RW, 128^ 
07600 077406 |0160000^0177777 |0760000-0777777 | 块 ， 供 WO 使 
用 


RW, 16^ 
与 内 核 主 程序 与 内 核 主 程序 的 | 块 ， 供 执行 程 
的 长 度 相关 MM 长 度 相关 序 的 PPDA 使 

















物理 内 存 物理 地 址 虚拟 地 址 


0 0 
0 _etext 
1 
2 . edata 
3 
4 
5 end 
6 0137777 0137777 
7 


proc[0] 的 PPDA 之 后 
的 部 分 作为 空闲 区 域 
注册 到 coremap 


0760000 0160000 





0777777 0177777 


user 


内 核 栈 区 域 
sp —> 


Kl 14-2 内 核 内 存 空间 


然后 ， 设 置 SR0， 激 活 MMU 使 之 有 效 。 从 此 时 开始 ， 可 将 虚拟 地 址 变 
为 物理 地 址 ， 进 程 的 虚拟 地 址 空间 处 于 有 效 状 态 。 


将 内 核 程序 的 bss 区 域 和 proc[0] 的 PPDA 清 0， 并 执行 main()。 执 
行 main() 时 ， 将 前 一 模式 设 定 为 用 户 模式 。 








代码 清单 14-2 start (m40.s) 





1 .globl start, end, edata, main 
2 start: 
3 bit $1,SSRO 


4 bne start 


reset 


内 核 APR@-5 的 初始 化 


mov $KISA0,r0 
mov $KISDO,r1 
mov $200,r4 
clr r2 
mov $6,r3 
mov r2,(r0)« 
mov $77406, (r1) 
add r4,nr2 
sob r3,1b 
内 核 APR6 的 初始 化 
mov $ end-63.,r2 
ash $-6,r2 
bic $11777,r2 
mov r2,(r0)« 
mov $usize-1N«8|6, (r1) 
内 核 APR7 的 初始 化 
mov $10, (re)t+ 
mov $77406, (r1) 


初始 化 栈 指针 ， 并 激活 MMU 使 之 有 效 











mov $ ur[usize*64.],sp 
inc SSRO 
清除 BSS 区 域 
mov $ edata,reO 
clr (re) 
cmp r0,$ end 
blo 1b 
将 proc[8] 的 user 和 内 核 栈 区 域 清 
mov $ u,re 
clr (re) 
cmp r0,$ ur[usize*64.] 
blo 1b 
调用 main() 
mov $30000,PS 
jsr pc, main 
mov $170000, - (sp) 
clr -(sp) 











0 


53 rtt 


3-4 WR MMU 已 处 于 有 效 状 态 ， 则 进入 循环 使 处 理 不 继续 进 
行 。SSR6 表示 SRO 寄存 器 的 地 址 (代码 清单 14-3) o SRO 的 最 低 
比特 位 为 1 时 表示 MMU 有 效 。 

代码 清单 14-3 SSRO (m40.s) 


1 SSRO - 177572 


8-9 KISAO. KISDO 分 别 表示 内 核 APRO fJ PAR, PDR 的 地 址 
(代码 清单 14-4) 。 


代码 清单 14-4 KISA0 和 KISD0 (m40.s) 


1 KISAO - 172340 
2 KISDO - 172300 


20-22 | end 表示 内 核 程序 bss 区 域 的 地 址 下 

限 。_etext、_edata、_end 分 别 指 癌 程序 的 代码 区 域 、 数 据 区 
区 域 的 地 址 下 限 ， 在 程序 编译 时 ， 由 链接 器 将 其 保存 到 符 
号 表 中 。 


对 赋予 PAR6 的 值 进行 计算 。 因 为 APR 以 64 字 节 为 单位 管理 物理 
WEW, MAK _end 以 64 字 节 为 单位 同上 取 整 ， 并 右 移 6 比特 ， 
保留 低位 的 10 比特 并 将 其 他 比特 位 清 0。 
24 设 定 PDR6 的 值 。 
27 IO 为 赋予 PAR7 的 值 〈 代 码 清单 14-5) 。 

代码 清单 14-5 IO (m40.s) 


1 IO - 7600 


31 设 定 栈 指针 的 值 。 


32 将 SRO 的 最 低 比 特 位 置 1 使 MMU 有 效 。 此 时 开始 可 以 将 虚 
拟 地 址 变换 为 物理 地 址 。 


35~39 将 内 核 程 序 的 bss 区 域 (从 _edata 到 _end) 清 0。 
42~46 将 proc[8] 的 user 结构 体 、 内 核 栈 区 域 清 0。 
49-50 ”将 前 一 模式 设置 为 用 户 模 式 并 执行 main()。 
main() 
main() 进行 下 列 处 理 〈 代 码 清单 14-11) 。 
。 初始 化 内 存 
。 初始 化 交换 空间 
。 初始 化 时 钟 装置 
e 生成 proc[6] 
。 初始 化 IO 资源 
。 生成 proc[1] 
将 物理 内 存 的 proc[8] 的 PPDA 之 后 的 部 分 清 0， 并 作为 空闲 领域 追加 
至 coremap。 将 实际 空闲 区 域 长 度 和 参数 MAXMEM 代码 清单 47 ) 中 


较 小 的 值 设 为 表示 空闲 区 域 长 度 〈 以 64 字 节 为 单位 ) 的 maxmem〔 代 码 
清单 14-6 ) 。 





代码 清单 14-6 maxmem (system.h) 


1 int maxmem; 


代码 清单 14-7 MAXMEM (param.h) 


1 4&define MAXMEM (64*32) 


通过 mfree() 分 配 交 换 空 间 中 的 空 闻 区 域 ， 并 将 其 赋予 swapmap. 14 
以 swplo 块 为 起 点 、 长 度 为 nswap 的 块 作为 交换 空间 注册 到 
swapmap 〈 代 码 清单 14-8 . 


代码 清单 14-8 swplo 和 nswap (conf.c) 


1 int swplo 4000; 
2 int nswap 872; 


Wep E PT E FLUUIUS IF BERE EL EX, n] ACER] PHURE BLUR EFE Rb PED 
可 在 使 用 时 选择 电源 频率 时 钟 装 置 。 


proc[0] 通过 手动 〈 并 非 newproc()) 创建 。proc[8] 为 系统 使 用 的 
densa 用 于 执行 sched() 和 swtch()。 当 前 目录 被 设 定 为 根 人 磁盘 
JR Hae 


执行 cinit()、binit()、iinit()， 分 别 对 字符 设备 缓冲 区 、 块 设备 
BIX., inode] 进行 初始 化 。 

执行 newproc() 生成 新 的 进程 (proc[1]) 。proc[1] 为 执 

行 %etcinit” 的 用 户 进程 ， 将 执行 容纳 在 icode[] 中 的 指令 集 (代码 清 
单 14-9 ) , icode[] 的 内 容 如 果 用 C 语言 编写 的 话 将 如 代码 清单 14-10 
所 示 。 


代码 清单 14-9  icode[] (ken/main.c) 








nt icode[] 


“~ 


0104413, /* sys exec; init; initp */ 
0000014, 

0000010, 

0000777, /* br . */ 

0000014, /* initp: init; © */ 
0000000, 

0062457, /* init: «/etc/initWX0» */ 
10 0061564, 

11 0064457, 


Ov 00 0Ul 5 uüuM.KH 


12 0064556, 
13 0000164, 
14 ); 





代码 清单 14-10 icode[] 的 C 语言 版 


1 char *init = "/etc/init"; 
2 execl(init, init, 09); 
3 while(1); 





代码 清单 14-11 main() Cken/main.c) 














1 

2 

3 extern schar; 

4 register i, *p; 

5 

6 updlock - 6; 

7 /* 初始 化 内 存 和 交换 空间 */ 

8 i = *ka6 + USIZE; 

9 UISD-»r[0] = 077406; 
10 for(;;) { 
11 UISA-»r[0] = i; 
12 if(fuibyte(0) < 0) 
13 break; 
14 clearseg(i); 
15 maxmem---4 ; 
16 mfree(coremap, 1, i); 
17 i++; 
18 } 
19 if(cputype -- 70) 
20 for(i-0; i«62; i=+2) ( 
21 UBMAP->r[i] = i<<12; 
22 UBMAP->r[i+1] = 6; 
23 } 
24 printf("mem = %l1\n", maxmem*5/16); 
25 maxmem = min(maxmem, MAXMEM); 
26 mfree(swapmap, nswap, swplo); 
27 
28 /* 初始 化 时 钟 装置 */ 
29 UISA->r[7] = ka6[1]; 

30 UISD-»r[7] = 077406; 


31 lks = CLOCK1; 


32 if(fuiword(lks) == -1) ( 




















33 lks = CLOCK2; 

34 if(fuiword(lks) == -1) 

35 panic("no clock"); 

36 } 

37 

38 /* 创建 进程 6 */ 

39 proc[6].p addr = *ka6; 

40 proc[0].p size = USIZE; 

41 proc[0O].p stat = SRUN; 

42 proc[0].p flag -| SLOAD|SSYS; 
43 u.u procp = &proc[0]; 

44 *lks - 0115; 

45 

46 /* 初始 化 资源 */ 

47 cinit(); 

48 binit(); 

49 iinit(); 

50 rootdir - iget(rootdev, ROOTINO); 
51 rootdir-»i flag =& -ILOCK; 

52 u.u cdir - iget(rootdev, ROOTINO); 
53 u.u cdir-»i flag =& -ILOCK; 
54 

55 /* 创建 进程 1 */ 

56 if(newproc()) { 

57 expand(USIZE+1) ; 

58 estabur(0, 1, 0, 0); 

59 copyout(icode, 0, sizeof icode); 
60 return; 

61 } 

62 sched(); 

63 } 





8~18 将 工 设 定 为 proc[8] 的 PPDA 区 域 后 方 的 地 址 。ka6 已 在 
m40.s 中 被 设 定 为 内 核 APR6 的 地 址 (KISA6) ， 通 过 *kae 可 以 
取得 APR6 的 值 (代码 清单 14-12) 。 


代码 清单 14-12 ka6 (conf/m40.s) 


1 _ka6: KISA6 


UISD 和 UISA 指向 用 户 APRO 的 PAR, PDP 的 地 址 〈 代 码 清单 14-13 


Kog 
代码 清单 14-13 UISD 和 UISA (seg.h) 


1 #define UISD 0177600 
2 #define UISA 0177640 





fuibyte() 用 来 复制 位 于 前 一 模式 虚拟 地 址 空间 中 长 度 为 1 字 节 的 数 
据 。 由 于 前 一 模式 为 用 户 模式 ， 因 此 fuibyte(8) 从 分 配给 用 户 APRO 
的 页 的 起 始 位 置 开 始 复制 数据 。 


循环 递增 用 户 PARO 的 值 ， 并 执行 fuibyte(8)， 如 果 成 功 ， 将 相应 地 
址 追加 至 coremap。 如 果 出 错 〈-1。 参 照 地 址 无 应 答 等 情况 ) ， 即 可 判 
断 已 到 达 物 理 地 址 的 终点 。 


29-30 ”将 用 户 APR7 设 定 为 内 核 APR7 的 值 ， 使 fuiword() 可 以 
访问 vo 区 域 。 


31~36 CLOCK1 和 CLOCK2 分 别 表示 电源 频率 时 钟 装 置 和 可 编程 时 
钟 装 置 的 的 寄存 器 地 址 (代码 清单 14-14) 。 对 CLOCK1 执行 
fuiword()， 如 果 失 败 则 选择 CLOCK2。 如 果 对 CLOCK2 执行 
fuiword() 也 失败 的 话 ， 则 执行 panic() 终止 处 理 。 


代码 清单 14-14 CLOCK (ken/main.c) 


1 #define CLOCK1 0177546 
2 itdefine CLOCK2 0172540 


30-43 wÆ proc[0]. (ff proc.p. addr 设 定 为 内 核 PAR6 的 值 ， 
并 为 proc.p_flag 设置 SLOAD 和 SSYS 标志 位 。SSYS 表示 系统 进 
程 ， 不 作为 交换 处 理 的 对 象 。 


56 生成 proc[1]。 


62 proc[0] 执行 sched() 。 由 于 不 是 交换 处 理 的 对 象 ， 因 此 
proc[0] 进入 睡眠 状态 并 将 控制 权 转 交 给 proc[1]。 


57-60 proc[1] 将 icode[] 复制 到 位 于 地 址 0 处 的 数据 区 域 的 起 
始 位 置 。 执 行 return 后 返回 至 start 调用 main() 的 位 置 (代码 
清单 14-15) ， 如 表 14-2 所 示 ， 将 值 压 入 栈 后 执行 rtt 指令 。rtt 
指令 从 栈 顶 将 0 读 取 至 pc， 将 0170000 读 取 至 PSW。 在 当前 模式 
和 前 一 模式 为 用 户 模式 的 状态 下， 从 用 户 空间 的 地 址 0 处 开始 执行 

中 令 。 因 为 icode[] 的 内 容 已 被 复制 到 地 址 0 处， 所 以 将 启动 执 
行 /etc/init 的 处 理 。 


代码 清单 14-15 start 中 的 相关 部 分 (conf/m40.s) 


51 mov $170000, - (sp) 
52 clr -(sp) 
53 rtt 


表 14-2 start 中 执行 rtt 时 的 栈 状态 





/etc/init 


/etc/init 为 用 户 程序 ， 在 此 只 做 简要 介绍 〈 图 14-3) ， 详 细 内 容 请 
参照 UPM (8) 。 


1. 对 已 注册 的 终端 创建 进程 。 


2. 进程 进入 待机 状态 等 待 拨 号 连接 终端 和 用 户 登 录 。 用 户 登 录 后 启动 
shell 程序 。 


3. /etc/init 在 这 之 后 进入 无限 循 环 状态 ， 对 失去 父 进程 的 进程 进行 持 
续 处 理 。 





^ 
z 


图 14-3 执行 init 后 进程 的 状态 


调度 器 
持续 执行 sched() 
和 swtch() 

/etc/init 
对 已 注册 的 终端 生 
成 相应 的 进程 后 ， 
进入 循环 处 理 失 去 
父 进程 的 进程 

与 各 终端 相对 应 的 进程 
等 待 拨号 连接 终端 
以 及 用 户 登 录 


14.2 小结 


e UNIX V6 月 动 时 ， 按 照 引 导 装 入 程序 ~ 引导 程序 -~ 内 核 主 程序 的 
顺序 ， 逐 步 执行 容量 较 大 的 程序 。 


e 局 动 时 的 处 理 包 括 : E MMU 有 效 ， 设 定 内 核 APR， 初 始 化 时 钟 装 
置 ， 初 始 化 内 存 和 交换 空间 ， 初 始 化 VO 资源 ， 生 成 proc[8] 和 
proc[1] 等 。 


。proc[8] 为 系统 进程 ， 作 为 调度 器 执行 。 
e proc[1] 用 于 执行 /etc/init. 


附录 参考 资料 等 


AA 参考 文献 、 网 站 
参考 书籍 、 网 站 等 


e [1] The Unix Tree (Minnie's Home Page) 
http://minnie.tuhs.org/cgi-bin/utree.pl 
可 在 此 阅览 UNIX V6 的 代码 。 


e [2] Unix V6 Manuals 
http://man.cat-v.org/unix-6th/ 
可 在 此 阅览 UNIX V6 的 手册 。 


e [3] Lions' Commentary on Unix 6th Edition / John Lions # / 
Annabooks/Rtc Books 出 版 / ISBN 978-1573980135 
由 John Lions 执笔 ， 介 绍 UNIX V6 的 书籍 1。 











(GEM UNIX 源 代 码 分 析 》 ， 机 械 工业 出 版 社 2000 年 7 月 出 版 ， 尤 晋 元 译 。 一 一 
译 者 注 








e [4] Commentary on the Sixth Edition UNIX Operating System 
http://www.lemis.com/grog/Documentation/Lions/ 
可 以 免费 获取 在 USENET alt.folklore.computers newsgroup 公开 的 此 
版 本 的 Lions 书 。 


e [5] Modern Operating Systems / Andrew S. Tanenbaum 3 / Prentice 
Hall 出 版 /ISBN 978-0136006633 
http:/www.pearsonhighered.com/educator/product/Modern-Operating- 
Systems/9780136006633.page 
经 常 作为 大 学 课程 的 教科 书 ， 是 一 本 很 经 典 的 书 ?。 


2 《现代 操作 系统 》， 机 械 工 业 出 版 社 2009 年 7 月 出 版 ， 陈 向 群 、 马 洪 兵 译 。 译 
注 





























e [6] Design of the UNIX Operating System / Maurice J. Bach # / 
Prentice Hall 出 版 /ISBN 978-0132017992 
使 用 了 很 多 的 插图 和 模拟 语言 ， 以 初期 的 UNIX 为 中 心 介 绍 UNIX 
的 书籍 3。 


3 中 译本 名 为 《UNIX 操作 系统 设计 》， 机 械 工 业 出 版 社 2000 年 4 月 出 版 ， 陈 葆 球 译 。 一 一 译 
者 注 








e [7] The Computer History Simulation Project 
http://simh.trailing-edge.com/ 
simh EMAER. VARIUSI T ERU BL PDP-11/40 在 内 的 较 古 
老 的 处 理 器 。 


e [8] Computer History Wiki 上 关于 安装 simh 的 网 页 
http://gunkies.org/wiki/Installing Unix v6 (PDP-11) on SIMH 
对 使 用 simh 启动 UNIX V6 的 方法 进行 了 说 明 。 





e [9] WikiPedia PDP-11 
http://en.wikipedia.org/wiki/PDP-11 
WikiPedia 上 PDP-11 页 面 的 相关 内 容 。 对 理解 框架 及 编译 器 很 有 大 
助 。 


论文 、 手 册 等 


e [10] The Unix Time-Sharing System / Dennis M. Ritchie, Ken 
Thompson 7# 
介绍 了 处 于 萌芽 时 期 UNIX 的 整体 概要 。 


e [11] UNIX Implementation / Ken Thompson 7# 
从 实现 的 角度 对 处 于 萌芽 期 的 UNIX 进行 介绍 。 


e [12] SETTING UP UNIX - Sixth Edition 
介绍 UNIX V6 的 环境 构筑 和 局 动 方法 。 对 希望 了 解 用 户 空 间 
Cuserland) 系统 程序 的 读者 会 有 帮助 。 


e [13] The UNIX IO System / Dennis M. Ritchie z& 
介绍 了 处 于 萌芽 期 的 UNIX 的 UO 处 理 。 


e [14] PDP11/40 processor handbook / DEC 公司 
PDP-11/40 的 使 用 手册 。 在 调查 处 理 器 的 详细 数据 、 指 令 集 时 是 必 
备 的 资料 。 


e [15] PDP Peripherals Handbook / DEC 公司 
PDP 周边 设备 的 使 用 手册 。 


e [16] C Reference Manual / Dennis M. Ritchie # 
UNIX V6 使 用 的 被 称 为 pre K&R C 的 C 语言 使 用 手册 。 


e [17] UNIX Assembler Reference Manual / Dennis M. Ritchie # 
UNIX V6 使 用 的 编译 器 的 参考 手册 。 


Lions'Commentary on UNIX 读书 会 会 员 的 网 站 


在 笔者 也 曾 加 入 过 的 Lions’ Commentary on UNIX 读书 会 会 员 制 作 的 网 
站 之 中 ， 选 择 一 些 刊 载 了 与 UNIX V6 相关 话题 的 网 站 在 此 进行 介绍 。 
由 于 每 个 话题 都 很 有 深度 ， 因 此 当 对 UNIX V6 内 核 的 理解 陷入 困境 ， 
或 是 希望 进一步 了 解 相关 信息 时 ， 这 些 网 站 一 定 会 有 很 大 的 帮助 。 


e [18] Lions'Commentary on UNIX 读书 会 
https://sites.google.com/site/lionscommentaryonunixreading/ 
Lion 书 读书 会 的 主页 。 刊 载 了 UNIX V6. V7 相关 网 站 的 链接 ， 以 
及 读书 会 举办 的 封闭 式 活动 的 记录 。 


e [19] A boring diary 
http://d.hatena.ne.jp/takahirox/ 
笔者 的 博客 。 可 视 为 本 书 的 基础 。 刊 载 了 本 书 中 未 涉及 的 细节 、 参 
加 Lions 书 读书 会 的 笔记 、 利 用 UNIX V6 模拟 器 进行 实验 的 记录 
等 内 容 ， 并 公开 了 笔者 自己 开发 的 UNIX V6 模拟 器 。 


[20] 2238 Club 

http://www.tom-yam.or.jp/2238/ 

浜 田 直 树 先生 的 网 站 。 刊 载 了 多 种 有 助 于 阅读 UNIX. V6 代码 的 资 
料 ， 以 及 UNIX V6、PDP-11 的 手册 和 相关 资料 。 对 本 书 未 介绍 
HJ, UNIX V6 中 最 难 理解 的 backup() 也 进行 了 说 明 。 


e. [21] 山本 英雄 先生 的 slideshare 








http://www.slideshare.net/magoroku15/ 

山本 英雄 先生 的 slideshare。 公 开 了 很 多 UNIX V6 的 说 明 资 料 。 入 
门 篇 易于 初学 者 起 步 ， 容 易 理 解 ， 与 本 书 配 套 使 用 一 定 会 加 深 理 
解 。 还 介绍 了 使 用 simh 确认 UNIX V6 内 核 处 理 的 方法 ， 以 及 在 
FPGA 上 执行 UNIX V6 的 资料 。 





[22] Plan9 日 记 

http://d.hatena.ne.jp/oraccha/ 

高 野 了 成 先生 的 博客 。 介 绍 了 包括 UNIX V6. PDP-11 的 引导 程序 
在 内 的 内 容 。 笔 者 在 对 UNIX V6 关联 资料 进行 调查 的 时 候 总 是 最 
终 查 看 这 个 博客 。 


[23] 七 志 的 开发 日 记 《〈 旧 ) 

http://d.hatena.ne.jp/n7shi/ 

七 志 先 生 的 博客 。 他 开发 了 UNIX V6 的 aout 解释 器 。 虽 然 七 志 先 
生 已 经 开设 了 新 的 博客 ， 但 在 此 还 是 要 介绍 一 下 刊载 了 UNIX V6 
相关 内 容 的 旧 博 客 。 


。 [24] FAEK 

http://toyoshim.blogspot.jp/ 

丰 岛 隆 志 先生 的 博客 。 在 Lions 书 读书 会 的 笔记 中 包含 了 很 敏锐 的 
观点 。 此 外 ， 还 介绍 了 重新 构筑 UNIX V6 内 核 并 加 入 自制 的 系统 
调用 的 方法 。 


[25] 电脑 羊 (Android Dream? 

http://xiangcai.at.webry.info/ 

在 山本 英雄 先生 制作 的 介绍 UNIX V7 的 Ustream^ 中 经 常 以 学 生 身 
份 登场 的 大 野 徽 先生 的 博客 。 他 将 Ustream 的 内 容 经 过 整理 并 上 传 
至 博客 。 由 于 UNIX V6 与 V7 并 没有 很 大 的 差别 ， 因 此 对 阅读 V6 
的 代码 一 定 会 有 很 大 帮助 。 


4 有 名 的 视频 分 享 网 站 。 一 一 译 者 注 

















A.2 pre K&RC 


本 市 针对 熟悉 现代 C 语言 的 读者 ， 介 绍 UNIX V6 使 用 的 pre K&R C 中 
较 难 理解 的 部 分 。 


运算 代入 
运算 代入 符 不 是 ep=， 而 是 =ep〔 代 人 码 清 单 A-1 ) 。 
代码 清单 A-1 加法、 减法 代入 


T 


" gw H m "m H H H | I 
9 1 


— > OA vV Xx X* 


1a 
2a 
3a 
4 a 
5a 
6 a 
7a 
8 a 
9a 
0 a 


m 





无 名 结构 体 

pre K&R C 允许 使 用 无 名 结构 体 ， 而 且 此 结构 体 的 成 员 可 以 对 任意 变量 
进行 使 用 。 使 用 无 名 结构 体 可 对 映射 到 内 存 周 别 设备 的 寄存 器 ， 或 对 2 
字 节 数据 的 高 位 和 低位 字 节 进行 操作 。 

代码 清单 A-2 演示 了 对 PSW 的 读 取 操作 。PS 为 PSW 映射 到 内核 地 
址 空间 ) 的 内 存 地 址 。 由 于 pre K&R C 不 支持 型 变换 (cast) ， 因 此 无 
法 直接 使 用 Ps 读 取 PSW 的 值 。 


此 处 使 用 具有 成 员 变 量 int integ 的 无 名 结构 体 ， 通 过 PS-»integ, 
用 int 型 从 Ps 表示 的 地 址 中 《强制 ) 读 取 长 度 为 1 个 字 的 数据 。 


代码 清单 A-2 操作 PSW 


1 /* param.h */ 














2 define PS 0177776 
3 

4 struct 

5 1{ 

6 int integ; 
7) 

8 


9 /* ken/slp.c */ 
10 /* in sleep() */ 
11 s - PS-»integ; 





下 面 再 给 出 一 个 例子 。 在 代码 清单 A-3 中 ， 通 过 RKADDR-»rkcs 可 以 访 
问 RK 磁盘 寄存 器 中 映射 至 地 址 0177404 处 的 的 tkcs 寄存 器 。 


代码 清单 A-3 ”对 Trkcs 的 操作 


1 /* dmr/rk.c */ 
2 #define RKADDR 0177400 


struct ( 
int rkds; 
int rker; 
int rkcs; 
int rkwc; 
int rkba; 
int rkda; 


}; 


13 /* in rkstart() */ 
14 RKADDR-»rkcs = RESET|GO; 





有 限 的 变量 类 型 


pre K&R C 中 没有 unsigned ©, PEH unsigned 型 时 可 以 用 指针 代 
蔡 。 此 外 ， 也 没有 long 型 ， 最 大 只 能 处 理 长 度 为 1 个 字 (16 比特 ) 的 
数据 。 因 此 在 处 理 更 大 的 数据 时 ， 需 要 使 用 数组 或 多 个 变量 。 


例如 ，file 结构 体 成 员 变 量 的 文件 俩 移 量 f offset. fEH]char* (16 
字 节 ) 的 数组 表现 32 字 节 的 数据 。f_offset[8] 对 应 高 位 16 比 

特 ，f_offset[1] 对 应 低位 16 比特 。 通 过 这 种 方式 进行 运算 时 ， 高 位 
16 比特 与 低位 16 比特 的 数据 必须 分 开 计 算 ， 显 得 十 分 党 琐 。 因 此 








UNIX V6 定义 了 专用 的 函数 ，dpadd() 用 于 加 法 ，dpcmp() 用 于 减法 
CERO 。 在 将 实际 读 写 量 追 加 至 文件 偏 移 量 的 处 理 中 也 使 用 了 这 些 函 
数 〈 代 码 清单 A-4 ) 。 


代码 清单 A-4 使 用 数组 表现 32 比特 的 数据 








/* file.h */ 

struct file 

i 
char f flag; 
char f count; 
int f inode; 


char *f offset[2]; 
) file[NFILE]; 


/* ken/sys2.c */ 
/* in rdwr() */ 
dpadd(fp-»f offset, u.u arg[1]-u.u count); 





Jai 

非常 感谢 大 家 能 完整 地 阅读 本 书 。 在 将 内 核 代 码 阅 读 一 所 之 后 ， 如 果 您 
能 够 感受 到 在 “前 言 ” 中 提 到 的 那些 效果 ， 笔 者 会 十 分 局 兴 。 如 采 感 觉 对 
有 些 内 容 的 理解 不 够 深入 ， 建 议 复习 一 所 ， 或 者 参考 相关 的 设计 书 及 论 
因为 已 经 对 整体 内 容 有 了 大 致 的 了 解 ， 相 信和 再 次 阅读 会 更 容易 理 


对 那些 已 经 相当 了 解 UNIX V6 内 核 的 读者 来 说 ,今后 的 学 习 之 路 也 有 
很 多 选择 ， 例 如 下 述 方法 。 


。 改写 UNIX V6 的 内 核 源 代码 ， 进 行 各 种 实验 
。 阅读 并 理解 本 书 未 做 说 明 的 内 核 源 代码 和 设备 驱动 源 代码 
e 跟踪 用 户 空间 Cuserland) 的 系统 程序 
。 理解 周边 设备 及 PDP-11/40 的 详细 设计 
。 逐步 将 学 习 的 范围 扩大 至 UNIX V7. BSD 等 较 新 的 操作 系统 
e 开发 PDP-11 的 模拟 器 ， 尝 试 在 其 中 运行 UNIX V6 
。 在 理解 内 核 处 理 的 基础 上 ， 对 开发 中 的 软件 进行 微调 
阅读 完 内 核 源 代码 之 后 ， 相 信 在 大 家 的 脑海 中 都 会 萌发 出 一 些 新 的 想 


法 。 衷 心 硕 望 大 家 能 够 退 随 这 些 想法 ， 继 续 技术 之 路 的 探索 ， 活 跃 在 计 
算 机 的 世界 当中 。 





看 完了 


如 采 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 有 编 
辑 或 作 译 者 协助 答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 


如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : 


ebookturingbook.com。 
在 这 里 可 以 找到 我 们 : 


WE @ 图 灵 教 育 : 好 书 、 活 动 每 日 播报 

WE @ 图 灵 社 区 : 电子 书 和 好 文章 的 消息 

WE ORRIA : 图 灵 教 育 的 科普 小 组 

微 信 图 灵 访 谈 : ituring_interview， 讲 述 码 农 精 彩 人 生 
WA 图 灵 教 育 : turingbooks 

















图 灵 社 区 会 员 或 许 未 必 不 过 〈185687308@qq.com) 专 享 尊重 版 权 


